«Компьютеры могут видеть, слышать и учиться. Добро пожаловать в будущее».

Определение:

  • Машинное обучение — это изучение различных типов алгоритмов искусственного интеллекта, которые обеспечивают самообучение на основе данных без явного программирования.
  • С помощью этой технологии компьютеры могут учиться сами по себе и улучшать свою точность и опыт с течением времени.

Цель:

  • Основная цель ML — наблюдать за данной проблемой или набором данных, определять скрытые закономерности и взаимосвязи и извлекать детали / информацию, которые помогают в принятии решений на основе данных и дают представление.

В любом наборе данных есть некоторые термины, которые помогают нам при выборе подходящей модели машинного обучения.

В основном существует три типа обучения:

  1. Контролируемое обучение
  2. Неконтролируемое обучение
  3. Обучение с подкреплением

Контролируемое обучение:

  • Тип машинного обучения, называемый обучением с учителем, использует предварительно размеченные данные для обучения машин или моделей, которые прогнозируют выходные данные на основе размеченных данных. Помеченные данные означают, что входные данные уже могут быть помечены желаемым результатом.
  • Когда в заданном наборе данных есть функции, наблюдения и ответы, этот тип машинного обучения (под наблюдением) становится более точным и эффективным. Обучение с учителем также можно описать как обучение, ориентированное на выполнение задач. Эти типы алгоритмов предсказывают выходные данные для заданных новых данных/входных данных.
  • При обучении с учителем цель состоит в том, чтобы найти функцию сопоставления, которая сопоставляет входные переменные (x) с выходными переменными (y).
  • Реальные приложения контролируемого обучения включают оценку рисков, классификацию изображений, обнаружение мошенничества, фильтрацию спама и другие.

Работает:

Пример:

Предположим, у нас есть набор данных, который содержит количество часов обучения студентов, а также соответствующие проценты, которые они получили. Итак, мы можем сказать, что нам даны ввод/характеристики (часы) и вывод/метка/ответ (процент).

Это означает, что мы можем обучать нашу модель по часам и процентам. В целях тестирования мы можем взять новые данные в качестве входных данных, проверить соответствующие выходные данные и определить, являются ли они точными или нет.

Контролируемое машинное обучение также можно разделить на две группы

  1. Регрессия (используется, когда данные непрерывны):
    Это оптимальный метод для выявления связи между зависимой и одной или несколькими зависимыми переменными.
  2. Классификация (используется, когда данные являются категориальными):
    Это метод контролируемого обучения, который используется для определения класса новых наблюдений на основе обучающих данных.
    Он предсказывает категориальные метки, также называемые классами или категориями.

Этапы контролируемого обучения:

  1. Определите тип обучающего набора данных или определите область проблемы.
  2. Соберите данные в соответствии с вашими требованиями, которые должны соответствовать выбранному вами домену.
  3. Разделите собранные данные на данные для обучения, данные для тестирования и данные для проверки.
  4. Определите входные характеристики обучающего набора данных, которые должны иметь соответствующие знания, чтобы модель могла точно предсказать соответствующие выходные данные.
  5. Выберите подходящий алгоритм для вашей задачи и ваших данных.
  6. Примените алгоритм к обучающему набору данных. Иногда наборы проверки необходимы в качестве параметров управления.
  7. Набор тестов следует использовать для определения точности модели.

Алгоритмы контролируемого обучения:

  • Линейная регрессия
  • Логистическая регрессия
  • Древо решений
  • SVM (машина опорных векторов)
  • Наивный Байес
  • K-ближайшие соседи
  • К-означает
  • Случайный лес
  • Алгоритмы уменьшения размерности
  • Алгоритмы повышения градиента

Обобщение относится к способности вашей модели должным образом адаптироваться к новым, ранее неизвестным данным, взятым из того же распределения, которое использовалось для создания модели.

Обучение без учителя:

  • Это тип машинного обучения, при котором модели обучаются с использованием немаркированного набора данных, такого как изображения, аудио, видео, рентгеновские снимки и т. д.
  • Это оптимальная техника машинного обучения, в которой пользователю не нужно контролировать модель, вместо этого она позволяет модели работать и обнаруживать закономерности, поэтому ее называют самоорганизованным обучением.
  • Неконтролируемое обучение выполняет более сложные задачи по сравнению с контролируемым обучением, но всегда существует проблема непредсказуемости модели.
  • Основная цель неконтролируемого обучения — найти структуру данных и сгруппировать их в соответствии с их сходством и ассоциативностью, а также представить данные в более сжатом формате.

"Обучение без учителя – это тип машинного обучения, при котором модели обучаются с использованием немаркированного набора данных и могут работать с этими данными без какого-либо контроля".

Работает:

Неконтролируемое машинное обучение также можно разделить на две группы

  1. Кластеризация.
    Простой способ группировки точек данных в различные кластеры. Объекты или точки, имеющие сходство, остаются в группе.
  2. Ассоциация.
    Правила ассоциации позволяют устанавливать ассоциации между объектами данных внутри больших наборов данных. Этот неконтролируемый метод предназначен для обнаружения интересных взаимосвязей между переменными в больших наборах данных. Например, люди, которые покупают новую машину, чаще всего покупают страховку.

Алгоритмы обучения без учителя:

  • Кластеризация K-средних
  • KNN (k-ближайшие соседи)
  • Нейронные сети
  • Априорный алгоритм
  • Иерархическая кластеризация
  • Обнаружение аномалий
  • Анализ независимых компонентов
  • Анализ основных компонентов

Обучение с подкреплением:

  • Это метод машинного обучения на основе обратной связи, в котором агент учится вести себя в среде, выполняя действия и видя результаты действий. За хорошее действие агент получает положительную обратную связь, а за вялое действие агент получает отрицательную обратную связь или штраф.

  • При обучении с подкреплением агент учится автоматически, используя обратную связь без каких-либо помеченных данных, в отличие от обучения с учителем. Агент взаимодействует непосредственно с окружающей средой и исследует ее самостоятельно.
  • Основная цель обучения с подкреплением — повысить точность и производительность за счет получения максимальных положительных отзывов или вознаграждений.

«Обучение с подкреплением — это тип метода машинного обучения, при котором интеллектуальный агент или компьютерная программа взаимодействуют с окружающей средой и учатся действовать в ней».

  • Обратная связь, которую агент получает после выполнения действия из среды, называется «Сигнал вознаграждения». Обучение с подкреплением (RL) связано с способностью изучать ассоциации между стимулами, действиями и возникновением приятных событий, называемых наградами, или неприятных событий, называемых наказаниями.

Термины, используемые в обучении с подкреплением

  • Агент(): Сущность, которая может воспринимать окружающую среду и воздействовать на нее.
  • Environment(): ситуация, в которой агент присутствует или находится в окружении.
  • Action(): Действия — это действия, предпринимаемые агентом в среде.
  • State(): состояние — это ситуация, возвращаемая средой после каждого действия, предпринятого агентом.
  • Reward(): обратная связь, возвращаемая агенту из среды для оценки действия агента.
  • Policy(). Политика — это стратегия, применяемая агентом для следующего действия в зависимости от текущего состояния.
  • Value(): Ожидается, что долгосрочная перенастроена с коэффициентом дисконтирования и противоположна краткосрочному вознаграждению.
  • Q-value(): в основном похож на значение, но принимает один дополнительный параметр в качестве текущего действия (а).

Элементы обучения с подкреплением

  1. Политика
    Политика может быть определена как способ поведения агента в данный момент времени. Политика — это основной элемент RL, поскольку это единственное, что определяет поведение агента.
  2. Функция/сигнал вознаграждения
    Когда обучающийся агент переходит из одного состояния в другое, среда немедленно посылает сигнал, называемый сигналом вознаграждения. Агенты получают вознаграждение в зависимости от их хорошего или плохого поведения.
  3. Функция ценности
    Функция ценности предоставляет информацию о ситуации и действиях агента, а также о том, какое вознаграждение агент может получить. Функции вознаграждения указывают на немедленный сигнал о каждом хорошем или плохом действии, а функции ценности описывают будущие состояния и действия.
  4. Модель
    Обучение с подкреплением также включает в себя модель, которая имитирует поведение среды. Модель используется для организации, что означает, что она обеспечивает метод принятия плана действий, рассматривая все будущие ситуации, прежде чем на самом деле столкнуться с этими ситуациями.

Применения обучения с подкреплением

  1. Беспилотные автомобили
  2. автоматизация промышленности
  3. Финансовый сектор
  4. Медицинский домен
  5. Система рекомендаций новостей
  6. Обработка изображений

Пример
Мобильный робот для сбора мусора решает, следует ли ему войти в новую комнату в поисках большего количества мусора или начать искать способ вернуться к своей станции подзарядки аккумулятора. Это решение принимается на основе того, насколько быстро и легко ему удавалось найти подпитку в прошлом. Это можно сделать с помощью алгоритма обучения с подкреплением.

Применения машинного обучения

  1. Распознавание изображений и речи.
  2. Рекомендация продукта.
  3. Анализ настроений.
  4. Языковой перевод.
  5. Чат-боты (виртуальные помощники).
  6. Обнаружение мошенничества, спама.
  7. Сортировка, тегирование, классификация фотографий.
  8. Включение бизнес-аналитики.
  9. Медицинский диагноз.
  10. Самоуправляемые транспортные средства.

Спасибо за прочтение

Если вам нравится моя работа и вы хотите меня поддержать…

  1. ЛУЧШИЙ способ поддержать меня — подписаться на меня на Medium здесь.
  2. Следуйте за мной на GitHub здесь.
  3. Подпишитесь на меня в LinkedIn здесь.
  4. Будьте одним из ПЕРВЫХ, кто подпишется на меня в Instagram здесь.