Публикации по тегам deep-reinforcement

Публикации по теме 'deep-reinforcement'

Обучение по политике против обучения вне политики в обучении с подкреплением

На основе политики: методы на основе политики изучают функцию значения или политику , которая используется для принятия решений непосредственно на основе данных, собранных агентом во время следуя своей нынешней политике. Политика, которую изучает агент, совпадает с той, которую он использует для взаимодействия со средой. Вне политики: методы вне политики, с другой стороны, изучают функцию значения или политику , используя данные, собранные другой политикой . Изученная политика..

Глубокое обучение с подкреплением для автоматизированной торговли акциями

Использование обучения с подкреплением для торговли несколькими акциями через Python и OpenAI Gym | Представлено на ICAIF 2020 Примечание редакторам Data Science. Хотя мы разрешаем независимым авторам публиковать статьи в соответствии с нашими правилами и рекомендациями , мы не поддерживаем вклад каждого автора. Не следует полагаться на работы автора без консультации с профессионалами. См. Подробности в наших Условиях для читателей . Этот блог основан на нашей статье:..

Публикации по теме 'deep-reinforcement'

Обучение по политике против обучения вне политики в обучении с подкреплением

Глубокое обучение с подкреплением для автоматизированной торговли акциями

Вопросы по теме