Вопросы по теме 'keras-rl'
Почему мой агент DQN не может найти оптимальную политику в недетерминированной среде?
edit: Следующее, похоже, также относится к FrozenLake-v0 . Обратите внимание, что меня не интересует простое Q-обучение, так как я хочу видеть решения, которые работают с пространствами непрерывного наблюдения.
Недавно я создал среду OpenAI...
1993 просмотров
schedule
18.08.2022
Можно ли тренироваться с тензорным потоком 1, используя float16?
В настоящее время тренируйте keras на модели тензорного потока с настройкой по умолчанию — float32.
После обучения сеть квантуется: веса перебрасываются в плавающие16. Это повышает производительность примерно в 3 раза при сохранении той же...
936 просмотров
schedule
19.06.2023