Великая единая теория ИИ: новый подход объединяет два преобладающих, но часто противоположных направления в исследованиях искусственного интеллекта

Великая единая теория ИИ: новый подход объединяет два преобладающих, но часто противоположных направления в исследованиях искусственного интеллекта
Великая единая теория ИИ: новый подход объединяет два преобладающих, но часто противоположных направления в исследованиях искусственного интеллекта

В 1950-х и 60-х годах исследователи искусственного интеллекта считали себя пытающимися раскрыть правила мышления. Но эти правила оказались намного сложнее, чем кто-либо мог себе представить. С тех пор исследования в области искусственного интеллекта (ИИ) вместо этого стали полагаться на вероятности - статистические закономерности, которые компьютеры могут изучать из больших наборов обучающих данных.

Вероятностный подход стал причиной большей части последних достижений в области искусственного интеллекта, таких как системы распознавания голоса или система, которая рекомендует фильмы подписчикам Netflix. Но Ноа Гудман, ученый-исследователь Массачусетского технологического института, чей факультет - мозг и когнитивные науки, а лаборатория - компьютерные науки и искусственный интеллект, считает, что ИИ слишком много пожертвовал, отказавшись от правил. Объединив старые системы, основанные на правилах, с идеями новых вероятностных систем, Гудман нашел способ моделирования мышления, который может иметь широкие последствия как для ИИ, так и для когнитивной науки.

Ранние исследователи ИИ рассматривали мышление как логический вывод: если вы знаете, что птицы могут летать, и вам говорят, что свиристель - это птица, вы можете сделать вывод, что свиристели могут летать. Одним из первых проектов ИИ была разработка математического языка, очень похожего на язык программирования, на котором исследователи могли бы кодировать такие утверждения, как «птицы могут летать» и «свиристели - это птицы». Если бы язык был достаточно строгим, компьютерные алгоритмы смогли бы прочесать записанные на нем утверждения и вычислить все логически обоснованные выводы. Разработав такие языки, исследователи ИИ начали использовать их для кодирования множества утверждений здравого смысла, которые они хранили в огромных базах данных.

Проблема такого подхода, грубо говоря, в том, что не все птицы умеют летать. И среди птиц, которые не умеют летать, есть различие между малиновкой в клетке и малиновкой со сломанным крылом, и еще одно различие между любой малиновкой и пингвином. Математические языки, разработанные ранними исследователями ИИ, были достаточно гибкими, чтобы представлять такие концептуальные различия, но записать все различия, необходимые даже для самых элементарных когнитивных задач, оказалось намного сложнее, чем предполагалось..

Принятие неопределенности

В вероятностном ИИ, напротив, компьютер получает множество примеров чего-либо, например изображений птиц, и ему предоставляется возможность самому сделать вывод о том, что общего у этих примеров. Этот подход довольно хорошо работает с конкретными понятиями, такими как «птица», но у него возникают проблемы с более абстрактными понятиями - например, с полетом, способностями, общими для птиц, вертолетов, воздушных змеев и супергероев. Вы можете показать вероятностной системе множество изображений объектов в полете, но даже если она выяснит, что у них общего, она, скорее всего, ошибочно идентифицирует облака, или солнце, или антенны на крышах зданий как примеры летающих объектов. полет. И даже полет - понятие конкретное по сравнению, скажем, с «грамматикой» или «материнством».

В качестве исследовательского инструмента Гудман разработал компьютерный язык программирования, названный Черчем - в честь великого американского логика Алонзо Черча - который, как и ранние языки ИИ, включает правила логического вывода. Но эти правила являются вероятностными. Узнав, что казуар - это птица, программа, написанная в Черче, может сделать вывод, что казуары, вероятно, умеют летать. Но если программе затем сказать, что казуары могут весить почти 200 фунтов, она может пересмотреть свою первоначальную оценку вероятности, заключив, что на самом деле казуары, вероятно, не умеют летать.

«С помощью вероятностных рассуждений вы получаете всю эту структуру бесплатно», - говорит Гудман. Программа Церкви, которая никогда не сталкивалась с нелетающими птицами, может изначально установить вероятность того, что любая птица может летать, на уровне 99,99%. Но по мере того, как он узнает больше о казуарах - и пингвинах, и о малиновках в клетках, и о сломанных крыльях - он соответствующим образом пересматривает свои вероятности. В конечном счете, вероятности представляют собой все концептуальные различия, которые ранним исследователям ИИ пришлось бы кодировать вручную. Но система сама учится этим различиям с течением времени - во многом так же, как люди изучают новые понятия и пересматривают старые.

«Что замечательно в этом, так это то, что он позволяет вам построить когнитивную модель гораздо более простым и прозрачным способом, чем вы могли бы сделать раньше», - говорит Ник Чейтер, профессор когнитивных наук и наук о принятии решений в Университетском колледже. Лондон. «Вы можете представить себе все, что знает человек, и пытаться перечислить их было бы просто бесконечной задачей, а может быть, даже бесконечной задачей. Но фокус в том, чтобы сказать: «Нет, нет, просто расскажи мне несколько вещи», и тогда мозг - или, в данном случае, система Черча, в чем-то аналогичная тому, как это делает разум, - может произвести, используя свой вероятностный расчет, все следствия и выводы. новой информации, он может выяснить последствия этого."

Моделирование ума

Программы, использующие вероятностный вывод, похоже, способны моделировать более широкий спектр когнитивных способностей человека, чем традиционные когнитивные модели. Например, на конференции Cognitive Science Society в 2008 году Гудман и Чарльз Кемп, который в то время был аспирантом BCS, представили работу, в которой они дали людям список из семи или восьми сотрудников вымышленной компании. и рассказал им, какие сотрудники послали по электронной почте кому другие. Затем испытуемым давали краткий список сотрудников другой фиктивной компании. Без каких-либо дополнительных данных испытуемых попросили составить диаграмму, показывающую, кто и кому отправлял электронные письма во второй компании.

Если шаблоны электронной почты в примере образуют цепочку - Алиса отправляет письмо Бобу, который отправляет письмо Кэрол, вплоть до, скажем, Генри - испытуемые-человеки, скорее всего, предсказывают, что электронная почта Шаблоны почты в тестовом примере также образуют цепочку. Если шаблоны электронной почты в тестовом случае образовывали петлю - Алиса отправляла письмо Бобу, который отправлял письмо Кэрол, и так далее, а Генри отправлял письмо Алисе, - испытуемые также предсказывали петлю в тестовом примере.

Программа, которая использовала вероятностный вывод и попросила выполнить ту же задачу, вела себя почти так же, как человек, выводя цепочки из цепочек и петли из петель. Но обычные когнитивные модели предсказывали совершенно случайные шаблоны электронной почты в тестовом примере: они не могли извлечь концепции более высокого уровня циклов и цепочек. Вместе с рядом сотрудников отдела мозга и когнитивных наук Гудман провел аналогичные эксперименты, в которых испытуемых просили рассортировать стилизованные рисунки жуков или деревьев по разным категориям или сделать выводы, требующие угадывания мыслей другого человека. Во всех этих случаях - некоторые из которых также были представлены на конференции Cognitive Science Society - программы Черча значительно лучше моделировали человеческое мышление, чем традиционные алгоритмы искусственного интеллекта.

Чейтер предупреждает, что, хотя программы Черча хорошо справляются с такими целевыми задачами, в настоящее время они слишком требовательны к вычислительным ресурсам, чтобы служить универсальными симуляторами разума. «Это серьезная проблема, если вы собираетесь решить любую проблему на свете», - говорит Чейтер. «Но он только что построен, а эти вещи всегда очень плохо оптимизированы, когда они только что построены». А Чейтер подчеркивает, что заставить систему работать вообще - это достижение само по себе: «Это то, что кто-то может выдвинуть в качестве теоретического предложения, и вы подумаете: «Вау, это фантастически умно, но я уверен». вы никогда не заставите его работать, правда. И чудо в том, что он запускается и работает."