Я решил прочитать и узнать больше о различных алгоритмах RL. Вот список алгоритмов, о которых, я надеюсь, я смогу узнать: (я стараюсь выбирать правильные названия для разных методов, насколько это возможно)

Может быть, я пробую технику в нескольких средах или несколько техник в среде. Я также надеюсь, что смогу реализовать некоторые методы RL на основе моделей и многоагентные методы RL. Я буду работать над самоуправляемыми автомобилями и RL в своей докторской диссертации и попытаюсь протестировать некоторые из этих методов в некоторых средах, таких как CARLA или тренажерный зал CarRacing env.

Есть много хороших ресурсов для изучения RL, которые я буду использовать, и вы можете найти некоторые из них здесь:









Серия «Глубокое обучение с подкреплением
Глубокое обучение с подкреплением — это принятие наилучших решений в зависимости от того, что мы видим и слышим. Звучит просто, но…medium.com»





И многие другие ресурсы, которые вы можете найти в Интернете.

Я просмотрел эти ресурсы с помощью задачи #100DaysOfMLCode, курса RL в Университете Аалто и исследований, которые я провожу для своей докторской степени. Я думаю, что это для этого поста. Мы продолжим работу с DQN в следующем посте.