Публикации по тегам reinforcement-learning

Публикации по теме 'reinforcement-learning'

Начало работы с обучением с подкреплением: путь новичка

Темы охватывали - Что такое обучение с подкреплением? - Зачем нам нужно обучение с подкреплением? - Применение обучения с подкреплением - Важные термины для обучения с подкреплением – Пример, понятный новичкам, чтобы понять, как это работает. - Сводка Что такое обучение с подкреплением? Обучение с подкреплением — это разновидность машинного обучения. Он работает на основе механизма вознаграждения и наказания. Агент вознаграждается за действия,..

Маршрутизация коммивояжеров на случайных графах с использованием обучения с подкреплением в PyTorch

Это совместная работа с Винсентом Стеттлером . Полный код доступен здесь . В этом посте мы рассмотрим захватывающую новую тему, а именно использование обучения с подкреплением для решения задач комбинаторной оптимизации на графах. Мы увидим, как это можно сделать конкретно для решения знаменитой проблемы коммивояжера. Наш подход объединит нейронные сети, которые изучают встраивания случайных графов, и обучение с подкреплением для итеративного построения решений. В итоге мы..

Как извлечь выгоду из RL-Lab

Обзор для новичков в обучении с подкреплением Reinforcement Learning — удивительная область, она дает ощущение волшебства. Тем не менее, это непростая тема для изучения, она тяжелая, она разочаровывает, особенно новичков. RL-Lab.com поставила перед собой задачу облегчить людям практику и изучение этой техники. Есть масса статей и видео, в которых рассказывается об этом, но они все равно не дают того непосредственного ощущения, которое возникает, когда ты пробуешь своими руками и..

Знаете ли вы, что ИИ может сам по себе находить способы умножать матрицы быстрее, чем мы…

DeepMind , подразделение Google, которое разрабатывает передовые инструменты машинного обучения для решения человеческих задач, недавно опубликовало AlphaTensor, алгоритм искусственного интеллекта для поиска гораздо более эффективных способов умножения матриц . Эта операция, которая может показаться немного занудной и специфической, на самом деле является неотъемлемой частью видеоигр и коммуникационных систем и, безусловно, требует значительных вычислительных ресурсов. На..

Машинное обучение — Руководство для неспециалистов

Вы, наверное, слышали, что в наши дни часто встречается термин «машинное обучение», часто сопровождаемый такими словами, как «алгоритм», «данные» и «прогнозы». Но что такое машинное обучение и как оно работает? Не волнуйтесь, мы здесь, чтобы объяснить это простыми словами. Что такое машинное обучение? Машинное обучение — это технология, которая позволяет компьютерам учиться и принимать решения без явного программирования. Это все равно, что дать компьютеру возможность улучшать свою..

Первый взгляд на обучение с подкреплением

Одним из типов обучения, о котором мы слышим в машинном обучении, является обучение с подкреплением, когда агент изучает цель в среде, известной или неизвестной, посредством вознаграждения и наказания. В отличие от таких методов обучения, как контролируемое и неконтролируемое обучение, обучение с подкреплением вообще не требует данных. В моем классе CS4100 курс кратко касался практики этого метода обучения, поэтому я хотел изучить его немного подробнее. Многие приложения обучения с..

Алгоритмы машинного обучения для абсолютных новичков

Искусственный интеллект есть везде. Если вы не знакомы с его концепциями, вы можете подумать о чем-то из I-Robot или Альтрона из кинематографической вселенной Marvel (отказ от ответственности: мне нравится его сухой юмор). Однако в этой статье я собираюсь демистифицировать машинное обучение, ветвь ИИ, таким образом, чтобы это было легко усвоить и не заставило вас ломать голову. Машинное обучение имеет так много применений в реальной жизни, особенно в бизнесе, таких как рекомендации по..