Путешествие от Сократа к ИИ через когнитивную науку

От Сократа к когнитивной науке

С тех пор, как Сократ попросил Фрасимаха дать определение концепции справедливости, философия впервые поставила один из самых сложных философских вопросов: что такое концепция? На протяжении многих сотен лет исследования природы и структуры понятий привлекали внимание лучших умов мира; тем не менее, только в шестнадцатом и семнадцатом веках такие исследования в полной мере процветали благодаря руке двух конкурирующих философских традиций: эмпиризма и рационализма.

Эмпирики утверждали, что концепции - это своего рода картинки или образы в уме. Согласно этой точке зрения, понятие собаки сводится к мысленному образу или образу прототипа собаки. Концепция справедливости, в свою очередь, сводится к комбинации мысленных образов или образов, которые мы обычно связываем с вещами и событиями, которые мы считаем справедливыми.

С другой стороны, рационалисты утверждали, что концепции не следует понимать как изолированные мысленные образы. Напротив, они утверждали, что концепции больше похожи на взаимосвязанные узлы в массивной логической сети.

Соперничество между эмпириками и рационалистами происходит из предыдущего и более фундаментального разногласия по поводу самой природы мысли и знания. Для эмпириков наличие концепции равносильно способности воспринимать и классифицировать объекты посредством мысленного вычисления всех характеристик восприятия, которыми обладают такие объекты. Например, представление о собаке - и, следовательно, наличие мыслей и знаний о них - означает способность отличать собак от вещей, не относящихся к собакам, на основе особенностей восприятия, которые обычно имеют такие объекты - отсюда и его название (« Эмпирия 'означает опыт на древнегреческом).

Для рационалистов, напротив, наличие концепции предполагает более требовательную когнитивную способность, то есть способность рационально делать все выводы, которые логически вытекают из нее. Так, например, наличие концепции собаки - и, следовательно, наличие мыслей и знаний о них - включает в себя возможность сделать вывод, что собаки - это млекопитающие, что млекопитающие - это животные, и собаки, и что животные отличаются от растений и таковы. собаки, растения и животные - живые существа, собаки - тоже, и так далее.

В настоящее время большинство дискуссий о концепциях ведется в рамках подхода когнитивной науки. Согласно этому подходу, разум аналогичен компьютеру. Итак, мышление понимается в терминах вычислений над репрезентативными структурами в уме (см. Thagard, 2018).

Подход когнитивной науки унаследовал многие концепции ранней современной философии. Фактически, эмпиризм и рационализм заложили основы когнитивной революции. Поэтому неудивительно, что в течение многих лет многие ученые-когнитивисты были вовлечены в долгую дискуссию между двумя конкурирующими теоретическими концепциями: с одной стороны, так называемый концептуальный эмпиризм, концептуальный атомизм, просто репрезентативный взгляд на концепции. ; с другой стороны, так называемая концептуально-ролевая семантика, логический вывод или просто прагматический взгляд на концепции (см. Margolis & Laurence, 1999). Первый утверждает, что концепции - это либо наборы семантических характеристик, основанных на восприятии (ментальные образы), либо какие-то ментальные слова, подобные лингвистическим. В обоих случаях концепции рассматриваются как изолированные ментальные репрезентации. Последний, напротив, утверждает, что концепции - это не ментальные репрезентации, а набор умозрительных способностей. Согласно этой точке зрения, значение понятия заключается в его выводных отношениях со многими другими понятиями.

Само собой разумеется, что разногласия между двумя сторонами воспроизводят такое же разногласие между эмпиризмом и рационализмом. Ведь на карту поставлено разногласие по поводу самой природы познания, т. Е. е., разногласия между теми, кто думает, что вся когнитивная архитектура в конечном итоге зависит от вычислений над изолированными наборами функций, и теми, кто думает, что мышление - это, по сути, вопрос вычислений в огромной сети логически взаимосвязанных узлов.

От когнитивной науки к машинному обучению

Вам, наверное, интересно, какое отношение все это имеет к машинному обучению и ИИ. Что ж, это действительно многое. Искусственные нейронные сети - это системы коннекционизма. Коннекционизм - это структура когнитивной науки, которая нацелена на моделирование ментальных явлений исключительно в терминах паттернов нейронной активации. Несмотря на отход от ранних вычислительных моделей разума, для которых мышление представляет собой просто вычисление над символическими ментальными структурами, коннекционистская модель заимствовала многие идеи из репрезентативной теории разума, в том числе взгляды эмпириков (атомистов или просто репрезентативные) на концепции (см. И Пилишин, 1988).

Итак, для коннекционистов концепции - это векторные представления признаков. Представление вектора признаков - это вектор, который представляет определенный объект или класс в пространстве признаков. Так, например, понятие «собака» - это не что иное, как вектор функциональной активности, представляющий класс «собака».

Хотя коннекционистский подход к концепциям оказался очень мощным, он также имеет свои ограничения. Современные алгоритмы машинного обучения действительно хороши для выполнения многих когнитивных задач, которые мы обычно связываем с такими понятиями, как распознавание вещей, поиск корреляций, классификация объектов, запоминание шаблонов, кодирование и извлечение информации и т. Д. Однако мы обычно чувствуем, что в значительной степени , эти алгоритмы - лучшая попытка моделирования реального человеческого познания. По предположению D’Mello et al. (2006):

Машинное обучение часто требует больших и точных обучающих наборов, мало осведомлено о том, что известно или неизвестно, плохо интегрирует новые знания со старыми, изучает только одну задачу за раз, позволяет мало переносить полученные знания на новые задачи ... В отличие от этого, человеческое обучение решила многие из этих проблем и, как правило, работает непрерывно, быстро, эффективно, точно, надежно, гибко и без усилий.

Я считаю, что многие ограничения, с которыми сейчас сталкиваются алгоритмы машинного обучения, отчасти вызваны отсутствием интегрированной концепции концептуального познания. Руководствуясь духом эмпирика, лежащим в основе репрезентативной теории разума, которая является стандартной позицией в когнитивной науке, коннекционистские (или нейросетевые) модели уделили слишком много внимания деятельности векторов признаков, полностью оставив логические отношения между концепциями. вне обсуждения.

Хотя предпринимались серьезные попытки объяснить концептуальные знания в терминах представлений реляционных графов, очень мало было сделано для реализации таких структур в нейронных сетях. К счастью, за последние несколько лет несколько исследований, связывающих теорию графов с нейронными сетями, дали очень интересные результаты. Эти исследования бывают разных видов. В настоящее время двумя наиболее важными проектами в этой области являются Реляционные нейронные сети (RNN) (см. Battaglia et al., 2018) и Graph Convolutional Networks (GCN) (см. Kipf & Welling, 2017). Оба направления исследований многообещающие, но предстоит еще долгий путь.

От машинного обучения к философии

Столкнувшись с двумя или более конкурирующими теориями, мы обычно чувствуем необходимость выбора между одной из них. Хотя во многих случаях это правильно, это не так, когда дело доходит до теоретизирования о познании. Предполагаемое соперничество между теми, кто думает о концепциях как представлениях векторов признаков, и теми, кто думает, что концепции являются узлами в реляционном графе, вводит в заблуждение. На мой взгляд, обе теории не являются соперниками, но на самом деле они должны работать вместе, чтобы создать более богатую и реалистичную модель человеческого познания.

В 1781 году Иммануил Кант опубликовал одну из самых замечательных философских и научных книг, когда-либо написанных: «Kritik der reinen Vernunft» (KrV). Среди прочего, Кант осознал, что эмпирики и рационалисты правы и неправы одновременно. Поскольку, согласно Канту, концептуальное знание является результатом как опыта (или интуиции в словаре Канта), так и правил вывода (или концепций в словах Канта), работающих рука об руку. . Ни интуиция, ни концепции сами по себе не могут привести никого к познанию мира. Цитата очень известную строчку из Kritik Канта:

Понятия без интуиции пусты. Интуиция без понятий слепа.

Я действительно думаю, что теория познания Канта может пролить новый свет на текущие дебаты в области когнитивной науки и искусственного интеллекта. В частности, я считаю, что процитированная выше цитата может быть вполне применима к дискуссии между вектором признаков и подходами к концепциям, основанными на логическом выводе. Ведь логические сети без представлений векторов признаков пусты, а представления векторов признаков без сетей вывода слепы. Позвольте мне немного расширить эту идею.

Как указывалось выше, подавляющее большинство современных алгоритмов машинного обучения полагаются исключительно на векторы функциональной активности. Эти алгоритмы в основном использовались для распознавания, классификации и запоминания шаблонов из того, что было введено в качестве входных данных. Однако для этого они должны быть обучены с большими объемами точных данных, и после того, как они научились на обучающем наборе, они демонстрируют небольшую способность обнаруживать и интегрировать новые знания из того, что они ранее узнали. Похоже, что машины когнитивно слепы. Они не могут не изобретать велосипед каждый раз, когда узнают что-то новое. Это серьезные проблемы.

Теперь предположим, что то, что требовалось машине для выполнения сложных когнитивных задач, - это просто вычисления над большими реляционными графами, содержащими тысячи и тысячи узлов, логически связанных между собой. Легко представить, как машина могла бы обнаруживать и интегрировать новые знания из того, что она узнала ранее. Для этого просто требуется вычислить соответствующие логические связи, которые существуют между данным понятием, скажем «собака», и многими другими понятиями, такими как «млекопитающее», «животное» и т. Д. Однако машина все равно ничего не узнала бы о собаках. Ведь без алгоритмов векторных признаков, работающих с фоном, он не смог бы распознать, классифицировать и запомнить что-либо, если бы ему были предоставлены реальные (изображения, слова или что-то еще) в качестве входных данных. Верно, что со временем машина узнает, что собаки - это млекопитающие, что млекопитающие - это животные, что животные - это живые существа и т. Д .; но в то же время он действительно ничего не узнал бы ни о чем из этих вещей. Их концепции были бы просто пустыми.

Уилфрид Селларс (1974), выдающийся американский философ и видный защитник неокантианского подхода к познанию, использовал, чтобы различать три различных типа концептуальных реакций:

  1. Ответы на ввод концепции: перцептивные входные данные вызывают соответствующие дискриминирующие / классификационные / узнаваемые концептуальные ответы.
  2. Внутриконцептуальные отклики: концептуальные отклики на вход запускают шаблоны правильных выводов по отношению к другим концепциям.
  3. Концептуальные реакции выхода: внутриконцептуальные реакции вызывают новые дискриминирующие / классификационные / узнаваемые концептуальные реакции.

Согласно этой картине, входные данные на начальном уровне обрабатываются, распознаются и классифицируются по концепциям. Эти концептуальные ответы, в свою очередь, вызывают логические ответы в отношении других концепций, многие из которых, возможно, не были обработаны на начальном уровне. Наконец, такие логические переходы могут вызывать новые распознающие / классификационные реакции на те концепции, которые не были обработаны на начальном уровне, позволяя системам изучать новые вещи без полной подготовки на начальном уровне.

Излишне говорить, что эта картина входа и выхода является чрезмерным упрощением человеческого познания. Некоторые ответы на ввод концепции могут непосредственно приводить к ответам на выход концепции; ответы на выход концепции могут работать как входные данные для ответов на ввод новых концепций; несоответствия между ответами на вход концепции и выход концепции могут привести к тому, что когнитивная система изменит или скорректирует шаблоны вывода между узлами и т. тонкое взаимодействие между различными типами ответов.

Заключение

Итак, чему философия может научить машинное обучение? Среди прочего, он может научить его тому, что настоящее глубокое обучение не может быть достигнуто без интеграции в единую картину (а) представления векторных признаков и (б) логические сети. Искусственный интеллект и машинное обучение не добьются большого прогресса в моделировании человеческого познания, пока это не будет полностью признано.

использованная литература