Публикации по теме 'reinfocement-learning'
Простая среда обучения с подкреплением с нуля
Обучение с подкреплением (RL) — это мощный класс машинного обучения, который, в отличие от обучения с учителем (еще один мощный класс), не требует помеченных данных для обучения машины/агента принятию разумных решений. RL вращается только вокруг двух элементов:
Окружающая среда: мир (симуляция), с которым взаимодействует актер/машина (т.е. агент). Агент: действующее лицо (например, робот, вычислительная машина и т. д.), обученное алгоритмом RL вести себя независимо и разумно...