Просто какая-то случайная мысль.

Мы знаем, что люди или любые живые существа могут реагировать на внешнюю среду, когда есть изменения или стимулы. Жизнь началась миллиарды лет назад, когда была ДНК, белок и некоторые другие вещества, а затем появились клетки и, наконец, они превратились в какие-то сложные вещества.

так как создать этот переход в виртуальном мире?

Я провел небольшое исследование и обнаружил, что это может быть метапрограммирование, автоматическое программирование, клеточное программирование, клеточные автоматы. Но они не совсем то, что я хочу. Кто-нибудь может помочь?

наивно, это должно быть похоже на обучение вводу-выводу, но трудно указать цель, для НЛП у нас есть несколько хороших моделей, таких как BERT, но это точно не интеллектуально. Цель жизни проста: просто выжить, прокормиться, размножиться и умереть.

обновление 1.

Я только что узнал, что есть аналогичная идея, называемая программой по примеру/документации или индуктивным синтезом программ (IPS).

обновление 2.

Сегодня я изучил то, что называется динамической нейронной сетью, традиционная IPS уже сильно изменилась с развитием глубокого обучения (здесь это нейронная сеть), саму нейронную сеть можно считать программой, которая, к сожалению, не имеет явного исходный код (вместо набора параметров) и поток управления

обновление 3.

сегодня я изучил ДХО, очень похоже, но, возможно, это не окончательный ответ.

обновление 4.

хотя некоторые методы RL включают в себя эволюционные методы, такие как генетическое программирование, где нет функции ценности, обычно люди сосредотачиваются на функции ценности и политике, поскольку это, возможно, более эффективно.

обновление 5.

подкрепление обучения кажется правильным способом сделать это.

Ссылка:

[1] Александр Л. Гонт и др., TerpreT: вероятностный язык программирования для индукции программ

[2] Ричард С. Саттон и Эндрю Г. Барто, Обучение с подкреплением: введение.