Публикации по теме 'reinfocement-learning'


Простая среда обучения с подкреплением с нуля
Обучение с подкреплением (RL) — это мощный класс машинного обучения, который, в отличие от обучения с учителем (еще один мощный класс), не требует помеченных данных для обучения машины/агента принятию разумных решений. RL вращается только вокруг двух элементов: Окружающая среда: мир (симуляция), с которым взаимодействует актер/машина (т.е. агент). Агент: действующее лицо (например, робот, вычислительная машина и т. д.), обученное алгоритмом RL вести себя независимо и разумно...