Вопросы по теме 'keras-rl'

Почему мой агент DQN не может найти оптимальную политику в недетерминированной среде?
edit: Следующее, похоже, также относится к FrozenLake-v0 . Обратите внимание, что меня не интересует простое Q-обучение, так как я хочу видеть решения, которые работают с пространствами непрерывного наблюдения. Недавно я создал среду OpenAI...
1993 просмотров

Можно ли тренироваться с тензорным потоком 1, используя float16?
В настоящее время тренируйте keras на модели тензорного потока с настройкой по умолчанию — float32. После обучения сеть квантуется: веса перебрасываются в плавающие16. Это повышает производительность примерно в 3 раза при сохранении той же...
936 просмотров
schedule 19.06.2023