Просто какая-то случайная мысль.
Мы знаем, что люди или любые живые существа могут реагировать на внешнюю среду, когда есть изменения или стимулы. Жизнь началась миллиарды лет назад, когда была ДНК, белок и некоторые другие вещества, а затем появились клетки и, наконец, они превратились в какие-то сложные вещества.
так как создать этот переход в виртуальном мире?
Я провел небольшое исследование и обнаружил, что это может быть метапрограммирование, автоматическое программирование, клеточное программирование, клеточные автоматы. Но они не совсем то, что я хочу. Кто-нибудь может помочь?
наивно, это должно быть похоже на обучение вводу-выводу, но трудно указать цель, для НЛП у нас есть несколько хороших моделей, таких как BERT, но это точно не интеллектуально. Цель жизни проста: просто выжить, прокормиться, размножиться и умереть.
обновление 1.
Я только что узнал, что есть аналогичная идея, называемая программой по примеру/документации или индуктивным синтезом программ (IPS).
обновление 2.
Сегодня я изучил то, что называется динамической нейронной сетью, традиционная IPS уже сильно изменилась с развитием глубокого обучения (здесь это нейронная сеть), саму нейронную сеть можно считать программой, которая, к сожалению, не имеет явного исходный код (вместо набора параметров) и поток управления
обновление 3.
сегодня я изучил ДХО, очень похоже, но, возможно, это не окончательный ответ.
обновление 4.
хотя некоторые методы RL включают в себя эволюционные методы, такие как генетическое программирование, где нет функции ценности, обычно люди сосредотачиваются на функции ценности и политике, поскольку это, возможно, более эффективно.
обновление 5.
подкрепление обучения кажется правильным способом сделать это.
Ссылка:
[1] Александр Л. Гонт и др., TerpreT: вероятностный язык программирования для индукции программ
[2] Ричард С. Саттон и Эндрю Г. Барто, Обучение с подкреплением: введение.