Машинное обучение прошло долгий путь от научной фантастики до надежного и разнообразного бизнес-инструмента, усиливающего несколько элементов бизнес-операций. На самом деле его влияние на эффективность бизнеса может быть настолько велико, что сегодня внедрение алгоритмов машинного обучения необходимо для поддержания конкурентоспособности в современных условиях независимо от сферы деятельности.

Тем не менее, несмотря на то, что шумиха о машинном обучении постоянно высока, а уровень его внедрения неуклонно растет (добавьте соответствующую статистику), общая осведомленность о том, что, почему и как технология, все еще относительно недостаточна.

Учитывая тот факт, что внедрение машинного обучения в бизнес-операцию является стратегическим шагом — имеет смысл понять, какие алгоритмы могут потребоваться для той или иной операции.

В этой статье мы разберем основные типы алгоритмов машинного обучения и объясним назначение каждого из них.

Типы алгоритмов машинного обучения

Алгоритмы контролируемого машинного обучения

Алгоритмы обучения с учителем — это те, которые предполагают прямое наблюдение (подсказка в названии) операции. В этом случае разработчик маркирует образец корпуса данных и устанавливает строгие границы, в которых работает алгоритм.

По сути, это упрощенная версия машинного обучения:

  • вы выбираете, какую информацию (выборки) «кормить» алгоритму;
  • какие результаты желательны (например, «да/нет» или «верно/неверно»).

С точки зрения машины, этот процесс становится более или менее рутиной «соединяй точки».

Основная цель контролируемого обучения:

  • масштабировать объем данных;
  • делать прогнозы недоступных, будущих или просто невидимых данных на основе помеченных выборочных данных.

Машинное обучение с учителем включает в себя два основных процесса: классификацию и регрессию.

  • Классификация означает способность системы различать типы информации, выполнять оптическое распознавание символов или изображений, а также бинарное распознавание (независимо от того, соответствует или не соответствует конкретный бит данных определенным требованиям в порядке « Да или нет"). Классификация маркирует входящие данные на основе прошлых выборок данных. Этот процесс вручную обучает алгоритм распознавать определенные типы объектов и соответствующим образом классифицировать их.
  • Регрессия, также известная как прогнозирование непрерывных результатов, означает, что машина понимает числа, их значения, группировку (например, высоту и ширину) и результаты. Этот процесс используется для выявления закономерностей и расчета прогнозов на их основе.

Наиболее распространены следующие алгоритмы:

  • Линейная регрессия,
  • логистическая регрессия;
  • случайный лес;
  • градиентные деревья;
  • Машины опорных векторов (SVM),
  • Нейронные сети,
  • деревья решений,
  • Наивный Байес,
  • Ближайший сосед.

Случаи применения

Наиболее распространенными областями использования контролируемого обучения являются прогнозирование цен и прогнозирование тенденций в продажах, розничной торговле и торговле акциями. В обоих случаях алгоритм использует поступающие данные для оценки возможности и расчета возможных результатов. Лучшими примерами являются платформы поддержки продаж, такие как Seismic и Highspot, использующие этот тип алгоритма для представления различных возможных сценариев для рассмотрения.

Обучение под наблюдением также используется в рекламных технологиях как часть последовательности доставки рекламного контента. Роль контролируемого алгоритма обучения заключается в том, чтобы оценивать возможные цены рекламных мест и их стоимость в процессе торгов в реальном времени, а также удерживать расходы бюджета в рамках определенных ограничений (например, диапазона цен на одну покупку и общего бюджета на определенный период времени).

Неконтролируемые алгоритмы машинного обучения

Неконтролируемое обучение — это обучение, которое не предполагает прямого контроля разработчика. Если ключевым моментом машинного обучения с учителем является то, что вы знаете результаты и должны отсортировать данные, то в случае алгоритмов машинного обучения без учителя желаемые результаты неизвестны и еще не определены.

Еще одно большое различие между ними заключается в том, что обучение с учителем использует исключительно помеченные данные, в то время как обучение без учителя использует немаркированные данные.

Это ключевая вещь, чтобы понять об этом. Алгоритм неконтролируемого машинного обучения используется для:

  1. исследовать структуру информации;
  2. извлечь ценную информацию;
  3. обнаруживать закономерности;
  4. внедрить это в свою работу, чтобы повысить эффективность.

Другими словами, он описывает информацию — просеивает ее и придает ей смысл.

Для этого в неконтролируемом обучении применяются следующие методы:

  • Кластеризация — исследование данных, используемое для разделения их на значимые группы (т. е. кластеры) на основе их внутренних шаблонов без предварительного знания учетных данных группы. Учетные данные определяются сходством определенных объектов данных, а также аспектами их непохожести на остальные (что также может быть использовано для обнаружения аномалий).
  • Уменьшение размерности. Входящие данные часто пронизаны шумом — кусками данных, которые практически не представляют интереса для требований конкретной операции. Уменьшение размерности используется для устранения этого шума при извлечении соответствующей информации.

Наиболее распространены следующие алгоритмы:

  • кластеризация k-средних,
  • т-СНЭ;
  • СПС;
  • Правило ассоциации.

Случаи применения

Цифровой маркетинг и рекламные технологии — это области, в которых неконтролируемое обучение используется с максимальной эффективностью. Кроме того, этот алгоритм часто применяется для изучения информации о клиентах и ​​соответствующей корректировки услуги.

Дело в том, что во входящих данных очень много так называемых «известных неизвестных». Сама эффективность бизнес-операций зависит от способности осмысливать неразмеченные данные и извлекать из них соответствующие идеи.

Неконтролируемое обучение может быть использовано для выявления групп целевой аудитории на основе определенных учетных данных (это могут быть поведенческие данные, элементы персональных данных, определенные настройки программного обеспечения или что-то еще). Это можно использовать для разработки более эффективного таргетинга рекламного контента, а также для выявления закономерностей в эффективности кампании.

Так или иначе, современные платформы управления данными оснащены неконтролируемыми алгоритмами для различных операций. Пожалуй, самые передовые возможности сейчас предоставляют Lotame и Salesforce.

Полууправляемые алгоритмы машинного обучения

Алгоритмы обучения с полуучителем представляют собой нечто среднее между алгоритмами с учителем и без учителя. По сути, полуконтролируемая модель сочетает в себе некоторые элементы обеих в нечто самостоятельные.

Вот как работают полууправляемые алгоритмы:

  • Алгоритм полууправляемого машинного обучения использует ограниченный набор помеченных выборочных данных для формирования требований операции (т. е. самого обучения).
  • Ограничение приводит к частично обученной модели, перед которой впоследствии ставится задача пометить неразмеченные данные.
  • Однако из-за ограничений выборки данных результаты считаются псевдоразмеченными данными.
  • Наконец, помеченные и псевдопомеченные наборы данных объединяются, что создает отдельный алгоритм, сочетающий описательные и прогностические аспекты контролируемого и неконтролируемого обучения.

С точки зрения техники полууправляемое обучение применяет процесс классификации для идентификации активов данных и процесс кластеризации для их группировки в отдельные части.

Случаи применения

В наши дни обучение с полуучителем широко используется в классификации веб-контента, анализе изображений и речи в области права и здравоохранения.

В случае классификации веб-контента полууправляемое обучение применяется для механизмов сканирования и систем агрегации контента. В обоих случаях он использует широкий набор меток для анализа содержимого и организации его в определенных конфигурациях. Однако эта процедура обычно требует участия человека для дальнейшей классификации.

Хорошим примером этого будет uClassify. Другим известным инструментом этой категории является GATE (Общая архитектура для текстовой инженерии).

В случае анализа изображения и речи алгоритм выполняет маркировку, чтобы предоставить жизнеспособную аналитическую модель изображения или речи с когерентной транскрипцией на основе образца корпуса. Например, это может быть МРТ или КТ. С помощью небольшого набора образцовых сканирований можно создать согласованную модель, способную идентифицировать аномалии в изображениях.

Алгоритмы машинного обучения с подкреплением

Обучение с подкреплением представляет собой то, что обычно понимается как машинное обучение искусственного интеллекта.

По сути, обучение с подкреплением — это разработка самоподдерживающейся системы, которая в ходе непрерывной последовательности попыток и неудач совершенствует себя на основе комбинации помеченных данных и взаимодействий с поступающими данными.

Эту последовательность можно назвать методом разведки/эксплуатации. В основном это выглядит так: совершается действие — результаты наблюдаются и реализуются в следующем действии.

В центре алгоритмов обучения с подкреплением находятся сигналы вознаграждения, возникающие при выполнении определенных задач. В некотором смысле сигналы вознаграждения служат инструментом навигации для алгоритмов подкрепления. Они дают ему понимание правильного и неправильного образа действий.

Существует два основных типа сигналов вознаграждения:

  • Положительныйсигнал вознаграждения побуждает к продолжению выполнения определенной последовательности действий.
  • Отрицательныйсигнал вознаграждения наказывает за выполнение определенных действий и призывает исправить курс, чтобы перестать получать штрафы.

Однако функция сигнала вознаграждения может варьироваться в зависимости от характера информации. Таким образом, сигналы вознаграждения могут быть дополнительно классифицированы в зависимости от требований операции. В целом, система пытается максимизировать положительное вознаграждение и свести к минимуму отрицательное.

Наиболее распространенные алгоритмы обучения с подкреплением включают в себя:

  • Q-обучение;
  • поиск по дереву Монте-Карло (MCTS);
  • Асинхронные агенты актер-критик (A3C);
  • Временная разница (TD).

Случаи применения

Машинное обучение с подкреплением подходит для случаев ограниченной или противоречивой доступной информации. В этом случае алгоритм может формировать свои операционные процедуры на основе взаимодействия с информацией и соответствующими операционными процедурами.

Чаще всего этот тип машинного обучения используется в видеоиграх (по этой модели действует большинство современных вражеских NPC). Обучение с подкреплением обеспечивает гибкость реакции ИИ на действия игрока, тем самым создавая реальные задачи. Например, он используется для обнаружения столкновения движущегося автомобиля и прохожего в серии Grand Theft Auto.

Также — обучение с подкреплением используется для самоуправляемых автомобилей. Например, если беспилотный автомобиль (например, Waymo) обнаруживает поворот дороги налево — он может активировать сценарий поворот налево и так далее.

Самым известным примером этого варианта обучения с подкреплением является AlphaGo, который сразился со вторым лучшим игроком в го в мире и переиграл его, вычислив последовательность действий вне текущей позиции на доске.

С другой стороны, обучение с подкреплением обычно используется в онлайн-маркетинге и, в частности, в рекламных технологиях. Дело в том, что обучение с подкреплением может сделать операцию ретаргетинга более гибкой и эффективной для достижения конверсии за счет тесной адаптации к поведению пользователя и окружающему контексту.

Кроме того, обучение с подкреплением используется для усиления и настройки обработки естественного языка и генерации диалогов для чат-ботов. Он может быть реализован для различных целей, например:

  • чтобы имитировать стиль входного сообщения
  • разработать более привлекательные, информативные ответы
  • Найдите релевантные ответы в соответствии с реакцией пользователя.

С появлением Google DialogFlow разработка такого бота стала скорее проблемой UX, чем техническим достижением.

***

Как видите, разные типы алгоритмов машинного обучения решают разные задачи.

Комбинация различных алгоритмов делает мощность способной решать самые разные задачи и извлекать ценные сведения из всех видов информации.