Введение

Пока вы читаете эту статью, вы определенно обращаете «внимание» на текст прямо перед вами, что происходит из-за скрытого внимательного поведения, вызванного потребностью в информации определенного типа. Ваши глаза сосредотачиваются на определенном тексте перед вами, и вы производите когнитивную расшифровку того же самого, что заставляет некоторые нейроны срабатывать и регистрировать это в вашей памяти. Все это требует энергии для выполнения действия, и вы не хотите, чтобы какая-либо из этой внимательной энергии ушла в канализацию для процесса, который не дает никакого конструктивного результата. Итак, вопрос в том, кем именно вы должны быть внимательный к окружающей среде, поставив задачу, которую вы выполняете с минимальными затратами энергии. Здесь в игру вступает экономика внимания. Прежде чем переходить к сфере внимания информатики, давайте сначала посмотрим, как работает нейробиологическое внимание.

Неврологическое внимание

В физиологической демонстрации внимание можно определить как бдительность или способность взаимодействовать с окружающей средой. Это очень похоже на слово «бдительность» в психологии. В нейробиологическом сообществе внимание является синонимом возбуждения, бдительности и бдительности.

Чтобы изучить паттерны внимания, исследователи взяли субъектов с разными физиологическими состояниями, такими как недосыпание, принимающие седативные препараты, сон-бодрствование, и попросили выполнить определенное задание, например, на время. помещали мяч в квадратную коробку в определенной области и коррелировали то же самое с сигналами ЭЭГ. Было интересно узнать, что производительность не так сильно сдерживала, когда за задачу подкреплялось достойное вознаграждение. Это означает, что не только физиологическое состояние, но и стимул к выполнению задачи влиял на уровень внимания у испытуемых.

Сенсорное внимание

Обработка визуальных сигналов над сенсорной системой была основным источником вдохновения для моделирования внимания в компьютерном сообществе. Они часто используются в исследованиях, направленных на изучение более общих когнитивных аспектов внимания. Визуальное внимание можно разделить на две категории: пространственное внимание и внимание, основанное на особенностях.

Визуально-пространственное внимание

Существует быстрое движение глаз, называемое саккадами, которое происходит несколько раз в секунду, что указывает на фокус визуального сигнала в текущий момент времени в пространстве. Световая волна достигает внутренней периферической области сетчатки, называемой ямкой. Это место, где сигнал длины волны света попадает в ямку, которая запускает нейронное внимание.

Исследователи изучают эти быстрые движения глаз разных субъектов на представленных изображениях, чтобы понять области фокуса на изображениях или заметность изображения. Первые несколько саккад представляют наибольший интерес, это самые рефлексивные саккады, не связанные с какой-либо пространственной информацией перед ними. Задача высокого уровня влияет, например, на если испытуемых просят угадать возраст человека на изображении.

В целом, изменения, связанные с вниманием, как полагают, увеличивают отношение сигнал / шум нейронов, которые представляют собой контролируемый стимул, однако они также могут влиять на связь между областями мозга. Для этого важно влияние внимания на нейросинхронизацию. Было показано, что в визуальной области внимание увеличивает согласованность пиков. Когда группа нейронов срабатывает синхронно, их способность влиять на общие нижележащие области увеличивается. Кроме того, внимание может быть направлено на прямую координацию коммуникации между областями.

Внимание к визуальным особенностям

В этом типе внимания испытуемых просят обратить внимание на определенные черты изображения. Например, глаз человека, круги на заднем фоне изображения и т. д. Задачи визуального поиска, такие как поиск шаблона, вызывают внимание, основанное на особенностях. Потенциальные источники нисходящего внимания, основанного на особенностях, были обнаружены в префронтальной коре, где устойчивая активность кодирует наблюдаемые особенности.

Конфликт конгруэнтности с другими сенсорными модальностями

В общем, использование нескольких конгруэнтных сенсорных сигналов помогает обнаружению объектов по сравнению с использованием только одного метода. Интересно, что некоторые исследования предполагают, что люди могут иметь предвзятость в отношении визуального домена, даже если сигнал из другого домена одинаково действителен. В частности, визуальная область, по-видимому, преобладает в задачах, требующих определения пространственного положения реплики. Лучше всего это можно увидеть в чревовещании, где визуальный сигнал движения рта манекена перекрывает слуховые свидетельства об истинном местонахождении источника голоса.

В целом, существуют разные способы, которыми можно повлиять на субъект, чтобы он обратил внимание на объект. Один из них - это произвольное внимание для достижения цели, обусловленной потребностью, называемой эндогенным вниманием. Есть еще один способ - это внимание, управляемое стимулами (восходящее), которое называется экзогенным вниманием.

Исполнительный контроль, память и внимание

Комбинация сенсорных входов с прошлыми знаниями для координации нескольких систем для эффективного выбора и выполнения задач является ролью исполнительного контроля, и этот контроль связан с префронтальной корой. Следствием трехсторонней связи между исполнительным контролем, рабочей памятью и вниманием является то, что содержимое рабочей памяти может влиять на внимание, даже если оно нежелательно для задачи. Например, если субъект должен сохранить объект в рабочей памяти, одновременно выполняя визуальный поиск отдельного объекта, присутствие сохраненного объекта в поисковом массиве может отрицательно повлиять на поиск. Это говорит о том, что рабочая память может мешать исполнительному контролю внимания.

Помимо гибкого управления вниманием в рамках сенсорной модальности, внимание также можно переключать между модальностями. Поведенческие эксперименты показывают, что переключение внимания между двумя разными задачами в рамках сенсорной модальности (например, переход от определения визуального объекта к его идентификации) или между сенсорными модальностями (переключение от слуховой задачи к визуальной) требует вычислительных затрат. Эта стоимость обычно измеряется как степень ухудшения производительности при испытаниях сразу после переключения задачи по сравнению с испытаниями, в которых повторяется одна и та же задача. Интересно, что переключение задач внутри модальности, по-видимому, требует больших затрат, чем переключение между модальностями. Считается, что такие открытия связаны с тем фактом, что переключение внутри модальности требует реконфигурации одних и тех же нейронных цепей, что труднее, чем просто задействовать схемы другой сенсорной системы.

Работа исполнительного контролера заключается в том, чтобы осознавать стоимость этих перемещений внимания и стараться их минимизировать.

Память - это кислород внимания

  • Когда испытуемых просят запомнить список слов, одновременно выполняя второстепенную задачу, которая разделяет их внимание, их способность сознательно вспоминать эти слова позже ухудшается (хотя их способность распознавать слова как знакомые не так сильно страдает).
  • Неявное статистическое обучение также может быть искажено вниманием.
  • Даже если поиск в памяти не происходит из общих ресурсов внимания, все же ясно, что некоторые воспоминания выбираются для более яркого извлечения в любой данный момент, чем другие.
  • Некоторые формы памяти возникают автоматически и в самом потоке сенсорной обработки. Прайминг - это хорошо известное явление в психологии, когда присутствие стимула в какой-то момент времени влияет на то, как последующие стимулы обрабатываются или интерпретируются. Например, слово «врач» может быть распознано быстрее после слова «больница», чем слова «школа».
  • Адаптацию также можно рассматривать как форму неявной памяти. Здесь нервные реакции уменьшаются после многократного воздействия одного и того же стимула. Уменьшая реакцию на повторение, изменения стимула становятся более заметными.

Внимание в AI

Что ж, индустрия искусственного интеллекта была атакована различными статьями о нейронных архитектурах, основанных на внимании, работающих на пределе возможной производительности псевдо-интеллекта, за последние 3 года. Было опубликовано множество работ, в которых пытались решить проблему квадратичной вычислительной сложности со слоем внимания. Порода преобразователей, а именно Performer, Linformer, Synthesizer, Linear Transformer, пытается использовать трюк с ядром низкого ранга, чтобы снизить сложность до nlogn. Кроме того, существует группа Set Transformer, Longformer, Routing Transformer, BigBird, которая пытается сосредоточиться на повышении эффективности памяти трансформаторов. Все эти методы пытаются сделать эффективными методы механизма внимания грубой силы, тем не менее, процесс, по сути, по-прежнему является грубой силой.

Вернемся на шаг назад, что такое внимание с точки зрения домена NN?

Рассмотрим это предложение: «Внимание - это не все, что вам нужно». Теперь, учитывая, что мы все понимаем концепцию встраивания слов, получаем векторное представление всего предложения. Давайте построим для него входную матрицу на основе векторных вложений. Мы берем скалярное произведение каждого вложения вектора с каждым вложенным вектором, чтобы создать косинусную матрицу оценки сходства. Итак, будет 36 вычислений косинусного подобия. Теперь эта оценка косинусного сходства нормализована суммой оценок косинусного сходства, полученной из всех вычислений. Наивысшее значение нормализованных оценок косинусного сходства каждого слова сохраняется в векторе, который называется контекстно-зависимым внедрением входных данных x.

Мы создаем весовые матрицы запроса, ключа и значений для всех слов в предложении. Запрос - это каждое слово в предложении, которому мы хотим уделить внимание, затем значение - это значение сходства косинуса, которое мы получили как наивысшее значение после нормализации оценки косинуса для разных входных слов, а затем значение - это векторное вложение для того же слова. Таким образом, этот показатель внимания рассчитывается для всех слов в предложении относительно друг друга. Для лучшего понимания перейдите по ссылке 3 в разделе благодарностей.

Итак, в основном, это все нормализованные скалярные произведения, умноженные на вектор встраивания слов, на который мы обращаем внимание, и это делается для каждой сущности / слова. Поскольку, как мы видим, этот способ внимания является детерминированным методом грубой силы, не самообучается и не эффективен для вычисления только требуемой оценки внимания.

Байесовская сеть верований внимания - вероятностный подход к вниманию

Более сложный подход к механизму внимания - это байесовские сети доверия. Он создает сеть декодера, моделируя веса внимания с иерархией гамма-распределений, и сеть кодировщика, складывая распределения Вейбулла. Модель, которая может постепенно научиться обращать внимание на различные модели внимания. Эти модели действительно хорошо работают, позволяя создавать модели, устойчивые к атакам противника. Эта школа мысли, направленная на построение веры, обновленная карта внимания между встраиванием во входное пространство, помогает нам создавать развивающиеся механизмы внимания. Давайте посмотрим, что такое биологическое внимание и что мы можем извлечь из него с точки зрения экономики внимания.

AGI и внимание

В компьютерной системе общего интеллекта энергия внимания - это вычислительная энергия, ресурсы, необходимые для выполнения логической операции, способствующие достижению желаемого результата. Управление системными ресурсами обычно называют «искусственным вниманием». Управление ресурсами и механизм контроля для выделения ограниченных системных ресурсов процессу получения наиболее важной информации.

Приведенный выше треугольник не требует пояснений с точки зрения объяснения трех измерений искусственного внимания. Нам необходимо определить процесс внимания, который находит золотую середину между обилием информации, ограниченными ресурсами и ограничениями по времени.

В области узкого ИИ есть предварительно запрограммированный режим, определенный для информации, которая должна обрабатываться для привлечения внимания, сколько ресурсов необходимо, а также временная сложность (O (n2)) алгоритма уже выполнена. Это не относится к системам AGI, предопределенная парадигма не будет работать, необходима динамическая парадигма. Таким образом, когда задача частично определена или не определена во время разработки, следующее неизвестно:

  • Актуальность данных: Какая информация важна для работы системы?
  • Релевантность процесса. Как часто система должна производить выборку информации?
  • Операционная эффективность. Как быстро система должна принимать решения?
  • Требования к ресурсам системы.

Система AGI должна генерировать ответы на вышеуказанные вопросы, взаимодействуя с операционной средой. Системы AGI должны иметь возможность автономной самореконфигурации на уровне архитектуры.

Давайте попробуем разобраться в этой общей диаграмме процесса внимания. Он начинается с реальной среды с данными различных модальностей, которые собираются с сенсорных устройств. Определен компонент смещения данных, который обеспечивает соответствие данных соответствующим шаблонам внимания, которые вытекают из конечной цели. Затем элементы данных отправляются в область релевантности процессов. Релевантность процессов имеет триггер для исполнительных устройств, что означает, что на какой модальности данных мы должны сосредоточиться, что обеспечивает веса для данных выборки. Контекстная оценка процесса определяется как эвристика внутри процесса. Данные и отображение процесса добавляют к образцам информацию о весе процесса, помимо весов срабатывания. Таким образом, можно сделать выборку эффективной.

Теперь перейдем к конкретной парадигме механизма внимания, который определяется системой OpenCog.

Сеть внимания к экономике - ECAN

Внимание в OpenCog воплощается в атомах. Информационный объект самого низкого уровня в гиперграфе используется для представления информации в OpenCog. Чтобы понять, что такое атомы и что такое атомное пространство, подумайте о прочтении моего блога о том же.

Внимание включает в себя отслеживание важности атомов в атомном пространстве. Есть элемент под названием Mind-Agent. Mind-Agent уделяет внимание тому вниманию, которое используют атомы, и затем награждается их важностью, когда они достигают системных целей. Агент разума - это программный модуль, рассматривайте его как поток. Новые интеллектуальные агенты могут быть добавлены в любое время процесса, запущенного на сервере OpenCog, всякий раз, когда запрашиваются новые атомы. В экземпляре фокуса внимания к каждому атому добавлено значение внимания.

Есть подтипы MindAgents:

  • ImportanceUpdatingAgent - предоставляет и собирает из атома веса краткосрочной важности (STI) и веса долгосрочной важности (LTI).
  • ImportanceDiffusionAgents - распространяет STI вместе с Hebbian Links. Hebbian Links - это связи, определенные между атомами, которые указывают на атомы, которые одновременно важны. Если атом попадает в фокус внимания процесса, хеббовская связь удерживает релевантность атома внутри процесса.
  • ImportanceSpreadingAgents - берет избыточную важность, которую имеет атом, и распределяет ее по HebbianLinks. Эта избыточная важность определяется как количество STI, превышающее порог распределения важности, и он обычно превышает границу фокуса внимания, чтобы гарантировать, что распределение важности не удаляет атомы из фокуса внимания.
  • ForgettingAgents - подавлять атомы с низким LTI.
  • HebbianLinkUpdatingAgents - обновляет веса HebbianLinks в зависимости от того, на чем сосредоточено внимание экземпляра OpenCog во время выполнения процесса.

Понять поток

  1. MindAgent дает атомам стимул, если они были полезны для достижения целей MindAgent.
  2. STI распространяется между атомами по HebbianLinks либо с помощью ImportanceDiffusionAgent, либо с помощью ImportanceSpreadingAgent.
  3. Агент HebbianLinkUpdatingAgent обновляет значения истинности HebbianLink в зависимости от того, находятся ли связанные атомы в фокусе внимания или нет.
  4. ForgettingAgent удаляет либо атомы, которые находятся ниже порога LTI, либо выше него.

Выбор экономического действия

OpenCogPrime имеет объект, называемый пулом активной схемы, который содержит схему, которая в настоящее время «активна». Он проверяет, какая схема должна быть выполнена, в зависимости от статуса схемы. Каждая схема состоит из набора модулей, и роль выбора действия состоит в том, чтобы выбрать, какие модули выполнять в течение данного цикла, а какие - приостановить. Модули в схеме связаны двумя способами

  1. модуль 1 передает свою валюту STI другому модулю 2.
  2. Завершение работы модуля 1 приводит к инициализации модуля 2.

Когда существует противоречие между исполняющим модулем M1 и модулем M2, выигрывает модуль, который может заплатить больше всего.

Выбор экономической цели

Цели - это не какие-то конкретные объекты, скорее, любой атом можно принять за цель. Цели с валютой LTI считаются суперцелями.

Математическая интуиция за вниманием Экономика

Краткосрочная важность может быть сформулирована как начальное значение важности + заработная плата (вход внимания) + рента (расходы на внимание). Ренту можно сформулировать двумя способами: один - статическая рента, где, если начальное значение важности выше определенного порога, Saf, рента - это сама стоимость ренты, иначе 0. Линейная рента имеет вес, связанный с ней как (Si - Saf) и нормализовано (RecentMaxrent- Saf), иначе 0.

Важность соединения, cij, значение ссылки hebbian, формулируется с помощью функции значения нормы, которая нормализуется с помощью RecentMaxSTI или RecentminSTI. . Определен коэффициент затухания конъюнкции, значение которого умножается на текущее вычисленное значение конъюнкции и предыдущее значение конъюнкции, и сумма составляет обновленное текущее значение конъюнкции. Вот как вычисляется значение ссылки hebbian.

Я работал над тем, чтобы понять текущую реализацию того же самого, разветвив репозиторий кода. Я чувствую, что в нынешнем понимании этой системы, которую я предлагаю, может быть пробел, но именно здесь и начинается самое интересное. Итеративное устранение пробелов в вашем понимании системы.

В системе распределения внимания в OpenCog есть определенные вещи, которые были предложены как работа будущего или работа в разработке. Вы можете проверить документацию на то же самое.

Вывод

Внимание в общем интеллекте включает в себя управление энергией нейро-рассуждения, гарантируя, что вы достигнете ожидаемой цели. Это включает в себя понимание окружающей среды и того, на какой переменной следует сосредоточить больше внимания, которая может динамически меняться во временном измерении. Ожидаемая цель сама по себе может иметь подцели для достижения, которые рекурсивно требуют выполнения только что определенного явления.

Это поле все еще находится в темной комнате, где люди стреляли без особого успеха, и в целом это относится к самой области общего интеллекта.

Дайте мне знать свои мысли или идеи в комментарии, чтобы просветить меня в правильном направлении.

До следующего раза, будь осторожен ☺ !!

Подтверждение

  1. Https://arxiv.org/pdf/2106.05251.pdf
  2. Https://arxiv.org/pdf/2009.06732.pdf
  3. Https://www.youtube.com/watch?v=0PjHri8tc1c
  4. Https://www.frontiersin.org/articles/10.3389/fncom.2020.00029/full
  5. Https://www.bu.edu/articles/2015/david-somers-samantha-michalka/
  6. Https://www.google.com/url?sa=i&url=https%3A%2F%2Flink.springer.com%2Fchapter%2F10.1007%2F978-1-4842-2580-6_1&psig=AOvVaw36xWCTyEpER8S3kDxDdqEx&ust=16289526s = vfe & ved = 0CAsQjRxqFwoTCICDocufrvICFQAAAAAdAAAAABAD
  7. Https://www.slideshare.net/HelgiHelgason1/agi2012-helgasonattention