Краткая история ИИ: куда движется отрасль
Кредит: Тара Уинстед из Pexels
Каждое поколение инструментов ИИ можно рассматривать как улучшение для тех, которые пошли раньше, но ни один из инструментов не направляется к сознанию.
Математический пионер и пионер вычислений Алан Тьюринг опубликовал статью в 1950 году с вступительным предложением: «Я предлагаю рассмотреть вопрос:« Могут ли машины думать? ».Далее он предлагает что -то, называемое имитационной игрой, теперь обычно называемой тестом Тьюринга, в котором машина считается интеллектуальной, если ее нельзя отличить от человека в слепых Лорн.
Пять лет спустя появилось первое опубликованное использование фразы «искусственный интеллект» в предложении для летнего исследовательского проекта Дартмута по искусственному интеллекту.
С тех ранних начала, с 1960 -х годов, была разработана филиал ИИ, который стал известен как экспертные системы.Эти системы были разработаны, чтобы получить человеческий опыт в специализированных областях.Они использовали явные представления знаний и, следовательно, являются примером так называемого символического ИИ.
Было много широко разрекламированных ранних успехов, в том числе системы для выявления органических молекул, диагностики инфекций крови и поиска минералов.Одним из наиболее привлекательных примеров была система под названием R1, которая в 1982 году, как сообщается, экономила корпорацию Digital Equipment Corporation US 25 млн долларов в год, разработав эффективные конфигурации своих систем мини-компьютера.
Ключевым преимуществом экспертных систем было то, что специалист по предмету без каких -либо экспертов по кодированию может, в принципе, создать и поддерживать базу знаний компьютера.Программный компонент, известный как механизм вывода, затем применил эти знания для решения новых проблем в предметной области, с следами доказательств, предоставляющих форму объяснения.
Все это было в ярости в 1980 -х годах, когда организации стремились построить свои собственные экспертные системы, и они остаются полезными частью ИИ сегодня.
Мозг человека содержит около 100 миллиардов нервных клеток или нейронов, взаимосвязанных дендритной (ветвирующей) структурой.Таким образом, в то время как экспертные системы были направлены на моделирование человеческих знаний, появлялась отдельная область, известная как консинизм, которая была направлена на то, чтобы моделировать человеческий мозг более буквально.В 1943 году два исследователя по имени Уоррен МакКаллох и Уолтер Питтс создали математическую модель для нейронов, в результате чего каждый из них будет производить двоичный выход в зависимости от его входов.
Одна из самых ранних компьютерных реализаций подключенных нейронов была разработана Бернардом Видроу и Тед Хофф в 1960 году. Такие разработки были интересными, но они имели ограниченное практическое использование до разработки алгоритма обучения для программной модели, называемой многослойным персептроном (MLP) в 1986 году.
MLP представляет собой расположение обычно трех или четырех слоев простых моделируемых нейронов, где каждый слой полностью взаимосвязан со следующим.Алгоритм обучения для MLP был прорывом.Он позволил первым практическим инструментом, который мог бы учиться из набора примеров (учебные данные), а затем обобщать, чтобы он мог классифицировать ранее невидимые входные данные (данные тестирования).
Он достиг этого подвига за счет подключения численных взвешиваний на соединениях между нейронами и настройки их, чтобы получить наилучшую классификацию с учебными данными, прежде чем быть развернутым для классификации ранее невидимых примеров.
MLP может обрабатывать широкий спектр практических приложений, при условии, что данные были представлены в формате, который он мог использовать.Классическим примером было распознавание рукописных персонажей, но только если изображения были предварительно обработаны, чтобы выбрать ключевые функции.
После успеха MLP начали появляться многочисленные альтернативные формы нейронной сети.Важным была сверточная нейронная сеть (CNN) в 1998 году, которая была аналогична MLP, кроме его дополнительных слоев нейронов для определения ключевых особенностей изображения, тем самым устраняя необходимость предварительной обработки.
Как MLP, так и CNN были дискриминационными моделями, что означает, что они могли принять решение, обычно классифицируя свои входные данные для получения интерпретации, диагностики, прогнозирования или рекомендаций.Между тем, разрабатывались другие модели нейронной сети, которые были генеративными, что означает, что они могли создать что -то новое после обучения на большом количестве предыдущих примеров.
Генеративные нейронные сети могут создавать текст, изображения или музыку, а также генерировать новые последовательности, чтобы помочь в научных открытиях.
Выделили две модели генеративной нейронной сети: сети генеративных окрашиваний (Gans) и трансформаторные сети.Ганс достигает хороших результатов, потому что они частично «состязательны», которые можно рассматривать как встроенный критик, который требует улучшения качества от «генеративного» компонента.
Трансформаторные сети стали известны с помощью таких моделей, как GPT4 (генеративный предварительно обученный трансформатор 4) и его текстовая версия, Chatgpt.Эти модели с крупным языком (LLMS) были обучены огромным наборам данных, взятым из Интернета.Отзывы человека еще больше улучшают их результаты благодаря так называемому обучению подкрепления.
Помимо создания впечатляющей генеративной возможности, обширный учебный набор означал, что такие сети больше не ограничиваются специализированными узкими доменами, такими как их предшественники, но теперь они обобщены, чтобы покрыть любую тему.
Возможности LLMS привели к устремленным прогнозам, захваченного миром ИИ.На мой взгляд, такое дефицит неоправданного.Хотя текущие модели, очевидно, являются более мощными, чем их предшественники, траектория остается твердой к большей способности, надежности и точности, а не к любой форме сознания.
Как отметил профессор Майкл Вулдридж в своих доказательствах Доме парламента Великобритании в 2017 году, «Голливудская мечта о сознательных машинах не неизбежно, и я действительно не вижу, чтобы нас не видит путь».Семь лет спустя его оценка все еще верна.
Есть много положительных и захватывающих потенциальных приложений для ИИ, но взгляд на историю показывает, что машинное обучение - не единственный инструмент.Символический ИИ по -прежнему играет роль, поскольку он позволяет включать известные факты, понимание и человеческие перспективы.
Например, автомобиль без водителя может быть предоставлен правилами дороги, а не изучает их примером.Система медицинской диагностики может быть проверена на медицинских знаниях, чтобы обеспечить проверку и объяснение результатов из системы машинного обучения.
Общественные знания могут быть применены для фильтрации оскорбительных или предвзятых результатов.Будущее яркое, и оно будет включать в себя использование ряда методов ИИ, в том числе некоторые, которые существуют уже много лет.
Эта статья переиздана из разговора по лицензии Creative Commons.Прочитайте оригинальную статью.
Нашли ошибку в тексте? Напишите нам.