Прочитайте Статья Рональда Шмельцера в Forbes о шагах, которые Amazon предпринимает для расширения использования обучения с подкреплением:

Обучение с подкреплением (RL) обычно применяется для решения игр и головоломок. От ранних приложений ИИ в шашках и шахматах до более поздних решений на основе RL, которые научились играть в некоторые из самых сложных игр, таких как Go, DOTA и многопользовательские игры, RL показал, что он может предложить значительную силу в решении некоторые из наиболее сложных задач, поставленных перед ИИ. Несмотря на возможности, подходы RL не так широко применяются на предприятии, как подходы к обучению с учителем или без учителя. Это связано с тем, что компании находят более ориентированные на задачи подходы к обучению с учителем, подходящие для распознавания, разговора и прогнозной аналитики шаблонов ИИ, а подходы к обучению без учителя, ориентированные на данные, применимы к моделям обнаружения паттернов и аномалий и гиперперсонализации. Таким образом, ориентированные на цель подходы RL подходят для автономных систем и шаблонов целевых решений.

Несмотря на более низкий корпоративный профиль RL, он имеет высокий статус в новостях и СМИ. DeepMind, приобретенная Google в 2015 году, произвела фурор своим подходом к QLearning, используя метод RL для победы над лучшими игроками во многих соревновательных играх. Они рассматривают RL как путь к решению многих общих проблем, и действительно, они рассматривают RL как возможный алгоритмический подход к решению проблемы общего искусственного интеллекта (AGI) общеприменимого метода машинного обучения. Хотя это еще предстоит выяснить, это, безусловно, дало людям пищу для размышлений, и такие личности, как Илон Маск, Макс Тегмарк и другие, предупреждали о неминуемой возможности сверхразума.

В то время как страхи перед неизбежным захватом машин, скорее всего, преувеличены, в действительности RL применяется к гораздо более приземленным действиям в реальном мире, таким как оптимизация ресурсов, планирование, навигация и подходы к моделированию сценариев.

В последнее время Amazon набирает обороты в сфере RL. На конференции AWS Re:Invent 2018 в Лас-Вегасе в прошлом году Amazon представила платформу DeepRacer RL и лигу, объединяющую индивидуальные навыки для разработки алгоритмов RL, которые могут оптимизировать путь автономного транспортного средства по контролируемому курсу. Хотя это может показаться тривиальным приложением, Amazon была в авангарде применения RL в своих реальных сценариях.

Подробнее в Forbes читайте здесь.