Публикации по теме 'reinforcement-learning'


Когнитивные модели визуального поиска
В Части 1 этой серии мы обсудили, как моделирование поведения пользователей станет вторым шагом в процессе создания адаптивных интерфейсов, которые персонализируются в соответствии с потребностями пользователя. В этом посте мы рассмотрим одну такую ​​модель симулятора для задачи Визуальный поиск в выпадающих меню. Давайте начнем с примера, где наша цель — создать пользовательский интерфейс, ориентированный на определенную демографическую группу (скажем, приложение для отслеживания..

Часть 5 - Обзор Q Network и снижение жадности
Глядя на то, что пошло не так, и становишься менее жадным В предыдущей части мы создали простой проигрыватель на основе нейронной сети и заставили его играть против случайного игрока, игрока с минимальным максимумом и недетерминированного игрока с минимальным максимумом. Хотя у нас был некоторый успех, общие результаты были неутешительными: Player | NN Player 1st | NN Player 2nd ============================================================== Random | Not bad but not..

Введение в обучение с подкреплением (RL)
Итак, как мы узнали из Введение в машинное обучение , обучение с подкреплением - это методика, при которой у нас есть агент, который будет предпринимать определенные действия в среде, чтобы попытаться достичь оптимального состояния. Но как мы можем это проиллюстрировать? Взгляните на следующую картинку. Здесь мы можем видеть, что агент предпримет определенное действие At, чтобы получить вознаграждение Rt в метку времени t. Но что мы должны предпринять, если нам известны награды?..

Введение в машинное обучение
Цель этой статьи — получить четкое представление о том, что такое машинное обучение, каковы подмножества машинного обучения, для чего используется машинное обучение, что делает машинное обучение интересной и популярной темой/технологией в настоящее время. Что такое машинное обучение? В то время как искусственный интеллект (ИИ) — это широкая наука о подражании человеческим способностям, машинное обучение — это особое подмножество ИИ, которое обучает машину тому, как учиться. Машинное..

Руководство по обучению с подкреплением: решение проблемы многорукого бандита с нуля на Python
У вас есть любимое кофейное заведение в городе? Когда вы думаете о кофе, вы можете просто пойти в это место, так как почти уверены, что получите лучший кофе. Но это означает, что вы пропускаете кофе, который подает местный конкурент этого заведения. А если вы попробуете все кофейные заводы одно за другим, вероятность попробовать худший кофе в вашей жизни будет довольно высока! Но, опять же, есть шанс, что вы найдете еще лучшую кофеварку. Но какое отношение все это имеет к обучению с..

Понимание обучения с подкреплением без особых усилий
Взрыв машинного обучения и его безграничные возможности применения в бесчисленных вертикалях не нуждаются в явном указании. Хотя вы, вероятно, сталкивались с вариантами использования, в которых выводы извлекаются из данных и применяется своего рода статистическое моделирование для извлечения полезной информации из воспринимаемых шаблонов, они обычно подпадают под категории контролируемых и неконтролируемое обучение. Существует третья категория машинного обучения, а именно..

Введение в машинное обучение|
Что такое машинное обучение? Машинное обучение — это отрасль науки, которая занимается программированием системы таким образом, чтобы они автоматически обучались и совершенствовались с опытом. Слово «обучение» означает распознавание и понимание входных данных и принятие мудрых решений на основе предоставленных данных. Очень сложно предоставить всем решение на основе всех возможных входных данных. Для решения этой проблемы разработаны алгоритмы. Эти алгоритмы строят знания из..