На прошлой неделе у меня была возможность посетить первый семинар и хакатон OpenAI для Spinning Up. Семинар проводил один из моих героев и ведущий исследователь глубокого обучения с подкреплением, Джош Ачиам. Первая половина воркшопа касалась основ глубокого обучения с подкреплением. Часть 2, представленная Джошем Ачиамом. После этого у нас был краткий разговор об обучении ловкости, представленный Matthias Plappert из команды робототехники OpenAI. Затем у нас был еще один замечательный разговор об обзоре безопасности AGI, представленный Дарио Амодеи из команды безопасности OpenAI.

Если вы не смогли присутствовать или вам интересно узнать о глубоком обучении с подкреплением, я настоятельно рекомендую ознакомиться с ресурсами, перечисленными ниже. Кроме того, освежите свою математику, потому что такие понятия, как уравнение Беллмана, могут быть довольно сложными. Признаюсь, у меня разболелась голова после обзора уравнения Беллмана только потому, что моя математика была невероятно ржавой. Небольшая группа из нас (в Сан-Франциско), присутствовавших на семинаре, будет собираться ежемесячно, чтобы продолжить изучение Deep RL. Я буду обновлять ресурсы с этих встреч.

Ресурсы