Математическая модель всего одного нейрона может предсказывать афтершоки землетрясения, используя только два параметра и логистическую регрессию (такую ​​же, что используется в системе уравнений Лотки-Вольтерра) с той же или большей точностью, что и глубокая нейронная сеть из шести скрытых слоев из 50 нейронов. в каждом, обрабатывая более 13 тысяч параметров.

История об этом наделала много шума в узких кругах в 2018–19 годах. С тех пор я постоянно задаюсь вопросом: не имеют ли современные версии искусственных нейронных сетей избыточный функционал, из-за которого непонятен основной принцип их работы?

Мне кажется, что простая древняя игра «камень-ножницы-бумага» помогает выявить именно такой фундаментальный принцип обучения у хаоса.

Игрока в «камень-ножницы-бумага» можно представить как гетероклиническую сеть трех фазовых состояний: камень (R), ножницы (S) и бумага (P). Возможные переходы между этими состояниями (варианты ходов), ребра сети обозначены стрелками, каждое из которых имеет свою вероятность.

Каждый новый ход в этой игре не зависит от предыдущего, а граф фазовых состояний игрока представляет собой классическую цепь Маркова или эпсилон-машину Кратчфилда.

Если все ходы (фазовые состояния) равновероятны, то игрок ведет себя совершенно хаотично. Определение вероятностей выбора ходов называется стратегией.

Если есть второй игрок, то какую бы стратегию он ни выбрал, он не сможет обыграть первого игрока в серии попыток. Наоборот, чтобы не проиграть, второй игрок должен придерживаться той же стратегии, что и первый.

Таким образом, выбор стратегии равновероятности всех ходов приводит к достижению равновесия Нэша. Названное в честь Джона Форбса Нэша и сформулированное им в докторской диссертации, равновесие как раз и означает, что в некооперативной игре существуют стратегии, позволяющие избежать проигрыша при большом числе попыток.

Пока у нас есть только один игрок, он постоянно меняет свои состояния, другими словами, колеблется или колеблется совершенно случайным образом.

Появление второго игрока ничего не меняет в его колебаниях. Причем второй игрок начинает колебаться так же непредсказуемо, как и первый.

Если выигрыш = 1, проигрыш = -1 и ничья = 0, то каждый игрок выиграет ровно столько, сколько проиграет другой. Это игра с нулевой суммой.

Если выигрыш = 1, проигрыш = -1 и ничья может дать одному игроку возможность выиграть больше, чем проиграет другой, то это будет игра с ненулевой суммой. Такой вариант возможен, если в правилах указано, что выплата, которую получают игроки в случае ничьей, составляет от 0 до 0,5.

Я хочу заострить внимание именно на этом моменте, потому что Юдзуру Сато и его коллеги в своей работе акцентировали внимание на ненулевой сумме игры, хотя, помимо отклонения результата от нуля, мы получаем еще и большую вариативность, используя такой шаг. Если вспомнить работы Ванчурина и Кацнельсона о появлении квантовой динамики в искусственной нейронной сети при обучении равновесия, то там авторы также добавили вариативность стохастической (случайной) динамике скрытого слоя, на входе которого выходной слой сети учился.

Теперь приступим к обучению. Если исходить из того простого принципа, что выигрыш служит подкреплением для корректировки вероятностей выбора ходов каждым из игроков, то система связанных уравнений репликатора оказывается очень подходящей для математического программирования такого процесса обучения.

Здесь тоже нужен акцент. Уравнения репликатора в теории игр полностью эквивалентны уравнениям Лотки-Вольтерра в эволюционной теории. Более того, уравнения репликатора являются адаптацией уравнений Лотки-Вольтерра к теории игр.

Акцент важен, поскольку здесь мы имеем дело с теми же процессами конкуренции без победителя, которые, опять же, просто называются по-разному. Именно уравнения двойного репликатора использовались Джеймсом Кратчфилдом и Сато для описания процесса обучения двух игроков (две гетероклинические сети в фазовом пространстве) во время игры в камень-ножницы-бумага.

Результат оказался очень интересным и до боли знакомым. Применение системы уравнений обучения к игре с нулевой суммой привело к тому, что игроки не достигли равновесия Нэша, а создали настоящий детерминированный хаос без аттракторов.

Хотя средние для серии игр с нулевой суммой не отличались от равновесия Нэша (чистая случайность), отклонения от средних на некоторых участках хода игры стали значительно сильнее. Случайность стала намного разнообразнее, так сказать.

При отклонении от нулевой суммы динамика игры стала еще интереснее. Давайте предоставим слово Сато: «Когда нарушается условие нулевой суммы, мы наблюдаем другие сложные динамические поведения, такие как гетероклинические орбиты с хаотическими переходными процессами». Естественно, речь идет об орбитах в фазовом пространстве. Это динамика конкуренции без победителей.

Два нейрона могут учиться друг у друга, имея доступ к одному и тому же источнику хаоса на уровне действия-восприятия, но никак не обмениваясь информацией друг с другом напрямую. Получается, что хаос становится медиумом (каналом передачи или источником информации), если в него внести разнообразие.

Чтобы это выяснить, нам понадобилось всего два нейрона, каждый из которых представляет собой простую сеть из трех состояний в фазовом пространстве, а также задание им динамики с помощью простой системы уравнений с нелинейной динамикой — уравнений, указывающих на наличие жизни, согласно Юджину Вигнеру. Теперь я буду называть их уравнениями обучения.

Любопытно, что динамика, подобная волновой функции в квантовой физике, может при определенных обстоятельствах возникать в эволюционирующей системе Лотки-Вольтерра, когда она достигает устойчивости.

Работа с примером такого поведения системы была опубликована в 2016 г. Джордже Минич из Технического университета Вирджинии и Синиса Паевич из Национальных институтов здравоохранения США предположили, что для объяснения эффекта формирования устойчивости нелинейных процессов в живой природе , необходимо создать теорию квантовоподобных процессов.

Ведь возникновение устойчивости в сложных адаптивных системах (таких как Лотка-Вольтерра) совершенно не соответствует классическим теориям устойчивости, а прекрасно укладывается в уравнение Шредингера с «постоянной Планка», которая в данном случае имеет другое значение, чем в квантовой физике, и зависит от системы.

Поэтому авторы работы подчеркивают, что предложенная ими теория описывает новый тип эмерджентной устойчивости, возникающей в биологических системах, и не пытаются утверждать, что классическая квантовая физика может быть применена на макроуровне.

Здесь я невольно вижу аналогию с волновой функцией, возникающей в нейронных сетях Ванчурина и Кацнельсона, когда сеть достигает равновесия в обучении.

Юджин Вигнер дал очень интересное определение волновой функции. Волновая функция объекта — это математическое понятие, состоящее из бесконечного числа чисел, содержащих все возможные знания об объекте. «Если знать эти числа, то можно предвидеть поведение объекта настолько, насколько его можно предвидеть. Точнее, волновая функция позволяет предсказать, с какой вероятностью объект произведет на нас то или иное впечатление прямо или косвенно».

Определенная таким образом волновая функция передает распределение значения без различия между квантовым (наблюдаемым) и обычным (наблюдаемым) мирами. Граница между субъективным восприятием и обычной объективной реальностью существует, но ее можно произвольно перемещать в очень значительной степени, потому что обычный мир — это виртуальная реальность, представляющая собой наилучшую попытку нашего разума осмыслить наше субъективное впечатление от наблюдения за волновой функцией. .

Использованная литература:

  1. Миньян, Арно (2019), Прогнозирование афтершоков: возвращение к исходной точке после провала глубокого обучения, Temblor, http://doi.org/10.32858/teblor.053
  2. Миньян, А., Броккардо, М. (2019) Один нейрон против глубокого обучения в прогнозировании афтершоков. Природа 574, Е1 – Е3. https://doi.org/10.1038/s41586-019-1582-8
  3. Юдзуру Сато, Эйдзо Акияма, Дж. Дойн Фармер. (2002) Хаос в изучении простой игры для двух человек. Труды Национальной академии наук, апрель 2002 г., 99 (7) 4748–4751; DOI: https://doi.org/10.1073/pnas.032086299
  4. Сато, Ю., и Кратчфилд, Дж. П. (2003). Связанные репликаторные уравнения для динамики обучения в мультиагентных системах. Физический обзор. E, Статистическая, нелинейная и физика мягких веществ, 67 (1 Pt 2), 015206. https://doi.org/10.1103/PhysRevE.67.015206
  5. Джон Ф. Нэш (1950) Точки равновесия в играх с участием n человек. Труды Национальной академии наук, январь 1950 г., 36 (1) 48–49; https://doi.org/10.1073/pnas.36.1.48
  6. Михаил И. Кацнельсон, Виталий Ванчурин (декабрь 2020 г.) Emergent Quantumness in Neural Networks. arXiv: 2012.05082 [quant-ph]
  7. Хофбауэр, Дж., и Зигмунд, К. (1998). Эволюционные игры и динамика населения. Кембридж: Издательство Кембриджского университета. https://doi.org/10.1017/CBO9781139173179
  8. Джордже Минич, Синиша Паевич (2016) Новая «квантовая теория в сложных адаптивных системах». Mod Phys Lett B. 30 апреля 2016 г .; 30(11): 1650201. Опубликовано в сети 29 марта 2016 г. doi: 10.1142/S0217984916502018
  9. Вигнер Э.П. (1995) Замечания по вопросу о разуме и теле. В: Мехра Дж. (ред.) Философские размышления и синтезы. Собрание сочинений Юджина Пауля Вигнера (часть B, исторические, философские и социально-политические статьи), том B / 6. Springer, Берлин, Гейдельберг.