Публикации по тегам reinforcement-learning

Публикации по теме 'reinforcement-learning'

Проект Бонсай — наш первый взгляд на него

В течение последних недель здесь, в SOUTHWORKS, мы играли с новой технологией Microsoft под названием Project Bonsai — платформой искусственного интеллекта, которая в настоящее время находится в состоянии предварительного просмотра. Это позволяет решать проблемы машинного обучения с помощью глубокого обучения с подкреплением, не требуя обширного опыта машинного обучения. Этот инструмент опирается на опыт людей, чтобы разбить проблему на более простые задачи и дать моделям машинного..

BEHAVIOR Стэнфорда оценивает 100 действий из повседневной жизни для воплощенного ИИ

Стремясь продвинуть растущую область воплощенного ИИ, исследователи Стэнфордского университета представили ПОВЕДЕНИЕ, эталон, включающий 100 реалистичных, разнообразных и сложных повседневных домашних действий в моделировании. BEHAVIOR решает такие задачи, как определение, реализация в симуляторе и оценка; и продвигает современное состояние, добавляя новые типы изменений состояния, такие как очистка поверхностей или изменение температуры объекта. Воплощенный ИИ относится к изучению и..

Чего мы хотим от объяснимого ИИ?

Как мы можем объяснить, почему системы машинного обучения делают такие прогнозы? Прежде чем мы сможем ответить на этот вопрос об объяснимом ИИ - тот, который Уилл Найт недавно описал как Темный секрет, лежащий в основе ИИ , нам нужно внимательно посмотреть, что именно мы подразумеваем под объяснением вещей. . Экспертные системы против современного машинного обучения Если мы оглянемся на экспертные системы 80-х годов, то у нас было то, что мы считали бы полной объяснимостью:..

Поммерман для автоматизированных игр: FFA

Г-жа Навья Сингх, г-н Каиро Гулати, г-н Аншул Дхулл, г-н Барат Мохан С., г-н Бхавиш Пахва, г-жа Комал Шарма Университет Беннета, Большая Нойда, Индия [email protected], [email protected], [email protected], [email protected], [email protected] АННОТАЦИЯ- Наша игра Pommerman основана на консольной игре Bommerman. Игра начинается на платформе 11 X 11. Pommerman — это многоагентная среда, состоящая из набора различных ситуаций и состоящая из четырех..

Как найти кратчайший путь с помощью обучения с подкреплением

Введение Добро пожаловать во вторую статью из серии, посвященной обучению с подкреплением (RL) и его приложениям. Сегодня мы увидим более сложное применение этой техники искусственного интеллекта. Давайте начнем! Теоретические основы Прежде чем рассматривать реальное применение обучения с подкреплением, вспомните некоторые теоретические определения, которые важны, но, если вас не интересуют технические детали, вы можете пропустить этот раздел. Этот метод изучает, как люди..

Самосовершенствующиеся чат-боты на основе глубокого обучения с подкреплением

Модель обучения с подкреплением (RL) для самосовершенствующихся чат-ботов, в частности, для чат-ботов типа FAQ. Елена Риччарделли, Дебмаля Бисвас Аннотация. Мы представляем модель обучения с подкреплением (RL) для самоулучшающихся чат-ботов, специально предназначенную для чат-ботов типа FAQ. Модель нацелена не на создание диалоговой системы с нуля, а на использование данных из пользовательских разговоров для повышения производительности чат-бота. В основе нашего подхода лежит..

Введение в обучение с подкреплением

В этой статье речь пойдет о обучении с подкреплением . Этот метод отличается от многих других методов машинного обучения, которые у нас есть, и имеет множество применений в обучающих агентах (ИИ) для взаимодействия с такими средами, как игры. Вместо того, чтобы кормить нашу модель машинного обучения миллионами примеров, мы позволяем нашей модели предлагать собственные примеры, исследуя окружающую среду. Идея проста. Люди учатся, исследуя ошибки и прошлый опыт и извлекая уроки из..