В предыдущих статьях об оптимизации гиперпараметров с использованием Optuna и Sweep Hyperparameter Sweep из Weights and Biases мы рассмотрели детали реализации использования различных инструментов оптимизации гиперпараметров (HPO) для моделей FinRL. FinRL — это проект с открытым исходным кодом, работающий в основном над созданием исследовательской базы для обучения с подкреплением в области финансов. У него также есть FinRL-Meta, универсальное место для всех исследований в области RL для финансов. Итак, в этом уроке мы реализуем Ray tuning для HPO моделей RLlib в FinRL.