Публикации по теме 'stable-baselines'
Пользовательские среды Gymnasium и агенты Stable-Baselines3 с несколькими входами
Алгоритмы обучения с подкреплением часто применяются к средам с необработанными входными кадрами в форме изображений, последовательностей изображений или векторов признаков. Обработка наблюдений изображений в Stable-Baselines3 выполняется с помощью кодировщиков признаков CNN, в то время как векторы признаков передаются непосредственно в многоуровневую нейронную сеть политик. Но что, если вы хотите объединить изображения и векторы в пространство наблюдения с несколькими входами?..
Реализация DQNClipped и DQNReg со стабильными базовыми показателями
Для мини-проекта я решил реализовать в коде некоторые алгоритмы из статьи Развитие алгоритмов обучения с подкреплением . Основная идея статьи состоит в том, чтобы разработать новые алгоритмы обучения с подкреплением (RL), представляя алгоритм в виде графа, допуская различные эволюции и выбирая наиболее эффективные из них.
Некоторые моменты из статьи для меня:
Разработанные алгоритмы могут загружаться из известного алгоритма (например, Deep Q Network (DQN)) или с нуля. Алгоритмы..
Вопросы по теме 'stable-baselines'
Как создать живой график matplotlib.pyplot в Google Colab?
К сожалению, невозможно создавать живые графики в записной книжке Google Colab, используя %matplotlib notebook , как в автономной записной книжке jupyter на моем ПК.
Я нашел два похожих вопроса, отвечая на вопрос, как добиться этого для сюжетных...
741 просмотров
schedule
11.11.2022
Стабильные базовые планы не работают с тензорным потоком
Поэтому я недавно вернулся к машинному обучению и решил начать курс Kaggle для ConnectX ( https://www.kaggle.com/learn/intro-to-game-ai-and-reinforcement-learning ). Я пытаюсь провести урок 4, в котором я использую stable-baselines + Tensorflow для...
2505 просмотров
schedule
31.08.2022
SubprocVecEnv не работает с Custom Env (Stable Baselines - Gym)
Я создал собственный env, используя в качестве родительского класса gym.Env, и все работает хорошо на одном ядре. Я запустил код следующим образом:
class MyEnv(gym.Env):
....
Но если я попытаюсь использовать SubprocVecEnv для ускорения...
236 просмотров
schedule
22.10.2022