Любые системы обучения должны забывать устаревшие знания. Энтропия кажется тем самым «принципом забывания» для обучающейся Вселенной.

Важность забывания для систем обучения

Несколько десятилетий назад люди считали, что забывчивость — это просто результат старения и угасания воспоминаний. Однако несколько человек, изучавших память, подумали: «Секундочку, это не сходится», и они начали думать, что, возможно, наш мозг устроен так, чтобы специально забывать. За последнее десятилетие было проведено большое количество исследований, подтверждающих эту гипотезу. Такие исследования показывают, что наш мозг не пассивно теряет воспоминания, а активно пытается их стереть. Наш мозг и, возможно, даже все животные по умолчанию работают таким образом [1].

Со временем стало очевидно, что забывание, также известное как быстротечность, играет важную роль, помогая нам понять структуру и особенности конкретной среды или обстановки. В результате эта идея хорошо согласуется с недавними точками зрения, появившимися в исследованиях нейронауки, которые подчеркивают важность забывания с точки зрения улучшения нашей способности принимать лучшие решения на основе этих знаний. Другими словами, это не обязательно плохо, когда мы забываем определенные детали или информацию. На самом деле нам может быть очень полезно, если мы сможем сосредоточиться на наиболее важных аспектах нашего окружения и принимать более обоснованные решения в будущем. Отфильтровывая менее важную информацию и вместо этого сосредотачиваясь на более важных частях, забывание помогает нам адаптироваться к новым ситуациям, облегчая нам обучение и адаптацию к новой среде [2].

Способность забывать играет решающую роль, помогая нам в нескольких аспектах, таких как расстановка приоритетов, улучшение нашего мышления, принятие обоснованных решений и повышение нашей креативности. Чтобы понять сложные идеи из огромного количества информации, хранящейся в нашем уме, нам нужен баланс между забыванием и сохранением памяти, который дает нам умственную гибкость, необходимую для понимания сложных идей. По сути, именно этот баланс позволяет нам увидеть большую картину среди множества деталей, чтобы мы могли различить более широкую картину [3]. В результате выборочного стирания определенных фрагментов информации мы можем сосредоточиться на том, что действительно важно и актуально для настоящего момента. В результате тонкой настройки нашей памяти мы можем сконцентрироваться на наиболее важных аспектах проблемы или ситуации, что в конечном итоге помогает нам решать проблемы и принимать более правильные решения. Этот процесс забывания и расстановки приоритетов также стимулирует развитие свежих идей и творческого мышления, высвобождая когнитивные ресурсы для проекта открытия новых связей и идей из-за этого процесса забывания и расстановки приоритетов.

Исследования в области нейронных сетей также вскоре столкнулись с проблемой катастрофического забывания [4]. Это явление возникает, когда нейронные сети теряют способность выполнять ранее изученные задачи после периода обучения новым. Причина этого в том, что независимо от любых ошибок, связанных с любыми другими задачами, которые изучает нейронная сеть, каждая из задач имеет свою собственную функцию ошибок, которую она пытается минимизировать. Типичная нейронная сеть содержит множество параметров, таких как веса и смещения, которые составляют сеть. Сети необходимо настроить эти параметры, когда она изучает новую задачу или меняет свое поведение, чтобы она могла изучить новую задачу. Во время тренировочного процесса именно это и произойдет с вами. В случае нейронной сети каждая ось представляет значение одного параметра в весовом пространстве сети.

Способность хранить данные считается бесценным достоянием людей, и в результате мы эволюционировали, чтобы иметь возможность сохранять жизненно важные навыки, отказываясь от других, которые больше не актуальны [5]. Оптимизируя наши когнитивные ресурсы и сосредотачиваясь на том, что действительно важно в нашей жизни, мы можем извлечь выгоду из этого естественного процесса выборочного сохранения памяти. Теперь инженеры и исследователи могут создавать машины, которые могут эмулировать тот же процесс адаптивного управления памятью в сфере технологий. Можно спроектировать машины, которые сохранят важную информацию и навыки, включив в искусственные системы принципы человеческой памяти и отфильтровав менее релевантные или устаревшие данные с помощью искусственного интеллекта [5]. Моделирование сна с использованием стратегий воспроизведения данных для нейронной сети показало улучшение производительности нейронных сетей и предотвращение катастрофического забывания [6].

Связь между энтропией и потерей информации

Было проведено значительное исследование, демонстрирующее существенную связь между энтропией и потерей информации [7], [8]. Энтропия имеет тенденцию к увеличению в контексте статистических распределений из-за потери информации, которая может быть вызвана двумя различными механизмами, оба из которых имеют одинаковую вероятность [7]. Первый тип потери информации возникает, когда функция распределения конкретной системы заменяется произведением функций распределения более низкого порядка, что приводит к потере информации. В результате такой замены исходная функция распределения упрощается, что может не включать в себя всех тонкостей исходной функции распределения, что привело бы к увеличению энтропии. Потеря информации также может произойти, когда исходная функция распределения преобразуется в новую с помощью интегрального уравнения, такого же, как те, которые встречаются в теориях стохастических процессов. Такое преобразование может привести к потере детализации и точности представления системы, что в конечном итоге приводит к увеличению статистической энтропии из-за этой потери детализации и точности [7]. Исследователи получают ценную информацию о поведении сложных систем, изучая взаимосвязь между энтропией и потерей информации, чтобы разрабатывать лучшие стратегии управления и обработки информации в различных приложениях, понимая взаимосвязь между энтропией и потерей информации [8].

В прах ты вернешься: энтропия как «принцип забывания» обучающейся вселенной

Существует тесная связь между знанием и течением времени во вселенной, а энтропия служит связующей силой между ними. Если рассматривать реальность как тип знания, то энтропию можно рассматривать как процесс потери устаревшей или ненужной информации. Для адаптивного процесса обучения, управляющего вселенной, этот универсальный принцип забывания является существенным. Любая система адаптивного обучения нуждается в процессе «забывания», чтобы она могла разучить то, что впоследствии не подтверждается, и оставить только те знания, которые постоянно подкрепляются. Чтобы система обучения считалась адаптивной, она должна быть способна забывать или разучивать информацию, которая не была подтверждена или усилена с течением времени, и одновременно запоминать информацию, которая продолжает подтверждаться. Такую роль, по-видимому, играет энтропия в нашей Вселенной.

Таким образом, существует сложная взаимосвязь между информацией, обучением и динамикой Вселенной. Энтропия способствует потере знаний с течением времени. Вот почему любая неподдерживаемая живая структура в конечном итоге рассыплется в прах. Без постоянного подкрепления знания в конечном итоге будут утеряны. Эту исчезающую память, создавшую знаменитую стрелу времени, можно математически описать как увеличение энтропии. Рост энтропии происходит из-за того, что состояние системы есть состояние знания. Без повторного подтверждения или подкрепления информация постепенно угасает, как память, которая с возрастом становится менее четкой. Следовательно, нашу вселенную можно рассматривать как состояние знания о какой-то более глубокой реальности, и это знание постоянно обновляется по мере того, как усваивается новая информация и отбрасывается старая.

Заключение

Информация, энтропия и время находятся в динамических отношениях, которые имеют глубокие последствия для нашего понимания конечной судьбы Вселенной. Возможно ли, что в процессе обучения мы приближаемся все ближе и ближе к нашей конечной цели, причем направление нашего путешествия менее важно, чем сама цель? Какова роль жизни в этом процессе, поскольку это единственный известный процесс, который обращает закон энтропии вспять? Означает ли это, что жизнь является ключом к процессу обучения? Наконец, вытекающий из вышеизложенного даже глубоко философский вопрос: если наша реальность есть состояние знания, которое постоянно обновляется в процессе обучения, не является ли существование «зла» просто проявлением преходящего остаточного неведения?

Ссылки:

[1] Л. Гравитц (2019). Важность забывания. Nature, 571 (июль), S12–S14. https://www.nature.com/articles/d41586-019-02211-5

[2] С. Чоудхури, Б. Дай, Ф. Мемоли (2018). Важность забывания: ограничение памяти улучшает восстановление топологических характеристик из нейронных данных. PloS one, 13(9), e0202561. https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0202561

[3] К. Кантор (2023). Почему забывание полезно для вашей памяти. https://www.columbiapsychiatry.org/news/why-forgetting-good-your-memory#:~:text=%20способность%20%20забыть%20помогает,%20лес%20через%20%20деревьев.

[4] К. Гревал (2021). Почему нейронные сети забывают и уроки мозга, Numenta. https://www.numenta.com/blog/2021/02/04/why-neural-networks-forget-and-lessons-from-the-brain/#:~:text=Why%20do%20neural%20networks %20забыть,ошибка%20из%20любой%20другой%20задачи.

[5] Альджунди, Р., Бабилони, Ф., Эльхосейни, М., Рорбах, М., и Туйтелаарс, Т. (2018). Синапсы с памятью: учимся тому, что (нельзя) забывать. В Материалы Европейской конференции по компьютерному зрению (ECCV) (стр. 139–154).

[6] Р. Голден, Ж. Э. Делануа, П. Санда, П., М. Баженов (2022). Сон предотвращает катастрофическое забывание в пиковых нейронных сетях, формируя совместное представление синаптического веса. PLOS Computational Biology, 18(11), e1010628.

[7] Дж. К. Баэз, Т. Фриц, Т. Лейнстер (2011). Характеристика энтропии с точки зрения потери информации. Энтропия, 13(11), 1945–1957.

[8] А. Исихара (1972). Потеря информации и увеличение энтропии. Journal of Mathematical Analysis and Applications, 39(2), 314–317.