Заявление об ограничении ответственности: это незавершенный проект, возможны ошибки!

Чтобы быстро восстановить свои знания в области обучения с подкреплением, я создал эту шпаргалку со всеми основными формулами и алгоритмами. Надеюсь, это может быть вам полезно.

Полную версию pdf вы можете найти здесь, а репо здесь.

Обновление 19.03.2018. Переписал Сарсу, следуя алгоритму Саттона и Барто.

Обновление 15 марта 2018 г.. Спасибо AlexandreBeaulne, который добавил Contraction Mapping, Sarsa и очистил латекс.

Запросы на вытягивание с новыми функциями более чем приветствуются!

Основная ссылка - Введение в обучение с подкреплением Саттона и Барто. Вы можете найти это здесь".

Может быть, вам также стоит прочитать и другие мои статьи:

Https://towardsdatascience.com/lets-fool-a-neural-network-b1cded8c4c07

Https://towardsdatascience.com/how-to-use-dataset-in-tensorflow-c758ef9e4428

Спасибо за чтение.

Франческо Саверио