Заявление об ограничении ответственности: это незавершенный проект, возможны ошибки!
Чтобы быстро восстановить свои знания в области обучения с подкреплением, я создал эту шпаргалку со всеми основными формулами и алгоритмами. Надеюсь, это может быть вам полезно.
Полную версию pdf вы можете найти здесь, а репо здесь.
Обновление 19.03.2018. Переписал Сарсу, следуя алгоритму Саттона и Барто.
Обновление 15 марта 2018 г.. Спасибо AlexandreBeaulne, который добавил Contraction Mapping, Sarsa и очистил латекс.
Запросы на вытягивание с новыми функциями более чем приветствуются!
Основная ссылка - Введение в обучение с подкреплением Саттона и Барто. Вы можете найти это здесь".
Может быть, вам также стоит прочитать и другие мои статьи:
Https://towardsdatascience.com/lets-fool-a-neural-network-b1cded8c4c07
Https://towardsdatascience.com/how-to-use-dataset-in-tensorflow-c758ef9e4428
Спасибо за чтение.
Франческо Саверио