Публикации по теме 'deep-reinforcement'


Обучение по политике против обучения вне политики в обучении с подкреплением
На основе политики: методы на основе политики изучают функцию значения или политику , которая используется для принятия решений непосредственно на основе данных, собранных агентом во время следуя своей нынешней политике. Политика, которую изучает агент, совпадает с той, которую он использует для взаимодействия со средой. Вне политики: методы вне политики, с другой стороны, изучают функцию значения или политику , используя данные, собранные другой политикой . Изученная политика..

Глубокое обучение с подкреплением для автоматизированной торговли акциями
Использование обучения с подкреплением для торговли несколькими акциями через Python и OpenAI Gym | Представлено на ICAIF 2020 Примечание редакторам Data Science. Хотя мы разрешаем независимым авторам публиковать статьи в соответствии с нашими правилами и рекомендациями , мы не поддерживаем вклад каждого автора. Не следует полагаться на работы автора без консультации с профессионалами. См. Подробности в наших Условиях для читателей . Этот блог основан на нашей статье:..