Packt Publishing попросили меня просмотреть Глубокое обучение с подкреплением с помощью Python, Судхарсан Равичандиран. Проведя несколько часов с книгой, я рад сообщить, что она мне нравится!

Самым важным аспектом большинства книг или курсов по программированию является то, насколько хорошо они помогают учащимся самим писать код. Как сказал мой старый начальник Себастьян Трун: Вы не худеете, наблюдая за упражнениями других людей.

В книге Равичандирана умело используются инструменты, предоставляемые Open AI Gym, наряду с TensorFlow, чтобы обеспечить множество коротких практических упражнений. Код предоставляется в записных книжках Jupyter, а также построчно объясняется в тексте книги. (Подсказка: просто нажать Run All Cells в записной книжке - это обман! Вы не научитесь, если не наберете код - и неизбежно отладите его - самостоятельно.)

Математические объяснения в книге кажутся мне немного скучными, а набор математических формул кажется неправильным.

Но это все простительно, потому что книга дала мне четкий и эффективный практический опыт. В течение часа после открытия книги (я пропустил мимо ушей): Я обучил глубокую сеть Q игре в Pacman!

Https://youtu.be/YgIkLVmCKqw

Первоначально опубликовано на http://davidsilver.blog 15 мая 2021 г.