Серия РЛ

Я решил прочитать и узнать больше о различных алгоритмах RL. Вот список алгоритмов, о которых, я надеюсь, я смогу узнать: (я стараюсь выбирать правильные названия для разных методов, насколько это возможно)

ДКН
УСИЛЕНИЕ
А2С и А3С
ТРПО
ППО
ДДПГ
САК
Обезьяна-X
R2D2
ИМПАЛА
Никогда не сдавайся
Агент57

Может быть, я пробую технику в нескольких средах или несколько техник в среде. Я также надеюсь, что смогу реализовать некоторые методы RL на основе моделей и многоагентные методы RL. Я буду работать над самоуправляемыми автомобилями и RL в своей докторской диссертации и попытаюсь протестировать некоторые из этих методов в некоторых средах, таких как CARLA или тренажерный зал CarRacing env.

Есть много хороших ресурсов для изучения RL, которые я буду использовать, и вы можете найти некоторые из них здесь:

CS 285
CS 285 в UC Berkeley Лекции: понедельник/среда, 10–11:30, Soda Hall, аудитория 306. Лекции будут транслироваться и записываться. The…rail.eecs.berkeley.edu

CS234: Reinforcement Learning Winter 2019
Среда, 13 марта: Подробную информацию о постерной сессии можно найти на площади Piazza. Среда, 13 марта: выпущено решение для задания 3…web.stanford.edu

Артур Джулиани — Medium
Читайте статьи Артура Джулиани на Medium. Аспирант Cog Neuro. Каждый день Артур Джулиани и тысячи других…medium.com

Серия «Глубокое обучение с подкреплением
Глубокое обучение с подкреплением — это принятие наилучших решений в зависимости от того, что мы видим и слышим. Звучит просто, но…medium.com»

Курс глубокого обучения с подкреплением
Вы изучите все основные концепции, которые необходимо освоить, прежде чем погрузиться в курс глубокого обучения с подкреплением…simonithomas.github.io

И многие другие ресурсы, которые вы можете найти в Интернете.

Я просмотрел эти ресурсы с помощью задачи #100DaysOfMLCode, курса RL в Университете Аалто и исследований, которые я провожу для своей докторской степени. Я думаю, что это для этого поста. Мы продолжим работу с DQN в следующем посте.

Серия РЛ

Вопросы по теме