Публикации по тегам keras-rl

Вопросы по теме 'keras-rl'

Почему мой агент DQN не может найти оптимальную политику в недетерминированной среде?

edit: Следующее, похоже, также относится к FrozenLake-v0 . Обратите внимание, что меня не интересует простое Q-обучение, так как я хочу видеть решения, которые работают с пространствами непрерывного наблюдения. Недавно я создал среду OpenAI...

1993 просмотров

18.08.2022

Можно ли тренироваться с тензорным потоком 1, используя float16?

В настоящее время тренируйте keras на модели тензорного потока с настройкой по умолчанию — float32. После обучения сеть квантуется: веса перебрасываются в плавающие16. Это повышает производительность примерно в 3 раза при сохранении той же...

936 просмотров

python tensorflow precision keras-rl

19.06.2023