Публикации по теме 'stable-baselines'


Пользовательские среды Gymnasium и агенты Stable-Baselines3 с несколькими входами
Алгоритмы обучения с подкреплением часто применяются к средам с необработанными входными кадрами в форме изображений, последовательностей изображений или векторов признаков. Обработка наблюдений изображений в Stable-Baselines3 выполняется с помощью кодировщиков признаков CNN, в то время как векторы признаков передаются непосредственно в многоуровневую нейронную сеть политик. Но что, если вы хотите объединить изображения и векторы в пространство наблюдения с несколькими входами?..

Реализация DQNClipped и DQNReg со стабильными базовыми показателями
Для мини-проекта я решил реализовать в коде некоторые алгоритмы из статьи Развитие алгоритмов обучения с подкреплением . Основная идея статьи состоит в том, чтобы разработать новые алгоритмы обучения с подкреплением (RL), представляя алгоритм в виде графа, допуская различные эволюции и выбирая наиболее эффективные из них. Некоторые моменты из статьи для меня: Разработанные алгоритмы могут загружаться из известного алгоритма (например, Deep Q Network (DQN)) или с нуля. Алгоритмы..

Вопросы по теме 'stable-baselines'

Как создать живой график matplotlib.pyplot в Google Colab?
К сожалению, невозможно создавать живые графики в записной книжке Google Colab, используя %matplotlib notebook , как в автономной записной книжке jupyter на моем ПК. Я нашел два похожих вопроса, отвечая на вопрос, как добиться этого для сюжетных...
741 просмотров

Стабильные базовые планы не работают с тензорным потоком
Поэтому я недавно вернулся к машинному обучению и решил начать курс Kaggle для ConnectX ( https://www.kaggle.com/learn/intro-to-game-ai-and-reinforcement-learning ). Я пытаюсь провести урок 4, в котором я использую stable-baselines + Tensorflow для...
2505 просмотров
schedule 31.08.2022

SubprocVecEnv не работает с Custom Env (Stable Baselines - Gym)
Я создал собственный env, используя в качестве родительского класса gym.Env, и все работает хорошо на одном ядре. Я запустил код следующим образом: class MyEnv(gym.Env): .... Но если я попытаюсь использовать SubprocVecEnv для ускорения...
236 просмотров