Введение в машинное обучение

«Компьютеры могут видеть, слышать и учиться. Добро пожаловать в будущее».

Определение:

Машинное обучение — это изучение различных типов алгоритмов искусственного интеллекта, которые обеспечивают самообучение на основе данных без явного программирования.
С помощью этой технологии компьютеры могут учиться сами по себе и улучшать свою точность и опыт с течением времени.

Цель:

Основная цель ML — наблюдать за данной проблемой или набором данных, определять скрытые закономерности и взаимосвязи и извлекать детали / информацию, которые помогают в принятии решений на основе данных и дают представление.

В любом наборе данных есть некоторые термины, которые помогают нам при выборе подходящей модели машинного обучения.

В основном существует три типа обучения:

Контролируемое обучение
Неконтролируемое обучение
Обучение с подкреплением

Контролируемое обучение:

Тип машинного обучения, называемый обучением с учителем, использует предварительно размеченные данные для обучения машин или моделей, которые прогнозируют выходные данные на основе размеченных данных. Помеченные данные означают, что входные данные уже могут быть помечены желаемым результатом.
Когда в заданном наборе данных есть функции, наблюдения и ответы, этот тип машинного обучения (под наблюдением) становится более точным и эффективным. Обучение с учителем также можно описать как обучение, ориентированное на выполнение задач. Эти типы алгоритмов предсказывают выходные данные для заданных новых данных/входных данных.
При обучении с учителем цель состоит в том, чтобы найти функцию сопоставления, которая сопоставляет входные переменные (x) с выходными переменными (y).
Реальные приложения контролируемого обучения включают оценку рисков, классификацию изображений, обнаружение мошенничества, фильтрацию спама и другие.

Работает:

Пример:

Предположим, у нас есть набор данных, который содержит количество часов обучения студентов, а также соответствующие проценты, которые они получили. Итак, мы можем сказать, что нам даны ввод/характеристики (часы) и вывод/метка/ответ (процент).

Это означает, что мы можем обучать нашу модель по часам и процентам. В целях тестирования мы можем взять новые данные в качестве входных данных, проверить соответствующие выходные данные и определить, являются ли они точными или нет.

Контролируемое машинное обучение также можно разделить на две группы

Регрессия (используется, когда данные непрерывны):
Это оптимальный метод для выявления связи между зависимой и одной или несколькими зависимыми переменными.
Классификация (используется, когда данные являются категориальными):
Это метод контролируемого обучения, который используется для определения класса новых наблюдений на основе обучающих данных.
Он предсказывает категориальные метки, также называемые классами или категориями.

Этапы контролируемого обучения:

Определите тип обучающего набора данных или определите область проблемы.
Соберите данные в соответствии с вашими требованиями, которые должны соответствовать выбранному вами домену.
Разделите собранные данные на данные для обучения, данные для тестирования и данные для проверки.
Определите входные характеристики обучающего набора данных, которые должны иметь соответствующие знания, чтобы модель могла точно предсказать соответствующие выходные данные.
Выберите подходящий алгоритм для вашей задачи и ваших данных.
Примените алгоритм к обучающему набору данных. Иногда наборы проверки необходимы в качестве параметров управления.
Набор тестов следует использовать для определения точности модели.

Алгоритмы контролируемого обучения:

Линейная регрессия
Логистическая регрессия
Древо решений
SVM (машина опорных векторов)
Наивный Байес
K-ближайшие соседи
К-означает
Случайный лес
Алгоритмы уменьшения размерности
Алгоритмы повышения градиента

Обобщение относится к способности вашей модели должным образом адаптироваться к новым, ранее неизвестным данным, взятым из того же распределения, которое использовалось для создания модели.

Обучение без учителя:

Это тип машинного обучения, при котором модели обучаются с использованием немаркированного набора данных, такого как изображения, аудио, видео, рентгеновские снимки и т. д.
Это оптимальная техника машинного обучения, в которой пользователю не нужно контролировать модель, вместо этого она позволяет модели работать и обнаруживать закономерности, поэтому ее называют самоорганизованным обучением.
Неконтролируемое обучение выполняет более сложные задачи по сравнению с контролируемым обучением, но всегда существует проблема непредсказуемости модели.
Основная цель неконтролируемого обучения — найти структуру данных и сгруппировать их в соответствии с их сходством и ассоциативностью, а также представить данные в более сжатом формате.

"Обучение без учителя – это тип машинного обучения, при котором модели обучаются с использованием немаркированного набора данных и могут работать с этими данными без какого-либо контроля".

Работает:

Неконтролируемое машинное обучение также можно разделить на две группы

Кластеризация.
Простой способ группировки точек данных в различные кластеры. Объекты или точки, имеющие сходство, остаются в группе.
Ассоциация.
Правила ассоциации позволяют устанавливать ассоциации между объектами данных внутри больших наборов данных. Этот неконтролируемый метод предназначен для обнаружения интересных взаимосвязей между переменными в больших наборах данных. Например, люди, которые покупают новую машину, чаще всего покупают страховку.

Алгоритмы обучения без учителя:

Кластеризация K-средних
KNN (k-ближайшие соседи)
Нейронные сети
Априорный алгоритм
Иерархическая кластеризация
Обнаружение аномалий
Анализ независимых компонентов
Анализ основных компонентов

Обучение с подкреплением:

Это метод машинного обучения на основе обратной связи, в котором агент учится вести себя в среде, выполняя действия и видя результаты действий. За хорошее действие агент получает положительную обратную связь, а за вялое действие агент получает отрицательную обратную связь или штраф.

При обучении с подкреплением агент учится автоматически, используя обратную связь без каких-либо помеченных данных, в отличие от обучения с учителем. Агент взаимодействует непосредственно с окружающей средой и исследует ее самостоятельно.
Основная цель обучения с подкреплением — повысить точность и производительность за счет получения максимальных положительных отзывов или вознаграждений.

«Обучение с подкреплением — это тип метода машинного обучения, при котором интеллектуальный агент или компьютерная программа взаимодействуют с окружающей средой и учатся действовать в ней».

Обратная связь, которую агент получает после выполнения действия из среды, называется «Сигнал вознаграждения». Обучение с подкреплением (RL) связано с способностью изучать ассоциации между стимулами, действиями и возникновением приятных событий, называемых наградами, или неприятных событий, называемых наказаниями.

Термины, используемые в обучении с подкреплением

Агент(): Сущность, которая может воспринимать окружающую среду и воздействовать на нее.
Environment(): ситуация, в которой агент присутствует или находится в окружении.
Action(): Действия — это действия, предпринимаемые агентом в среде.
State(): состояние — это ситуация, возвращаемая средой после каждого действия, предпринятого агентом.
Reward(): обратная связь, возвращаемая агенту из среды для оценки действия агента.
Policy(). Политика — это стратегия, применяемая агентом для следующего действия в зависимости от текущего состояния.
Value(): Ожидается, что долгосрочная перенастроена с коэффициентом дисконтирования и противоположна краткосрочному вознаграждению.
Q-value(): в основном похож на значение, но принимает один дополнительный параметр в качестве текущего действия (а).

Элементы обучения с подкреплением

Политика
Политика может быть определена как способ поведения агента в данный момент времени. Политика — это основной элемент RL, поскольку это единственное, что определяет поведение агента.
Функция/сигнал вознаграждения
Когда обучающийся агент переходит из одного состояния в другое, среда немедленно посылает сигнал, называемый сигналом вознаграждения. Агенты получают вознаграждение в зависимости от их хорошего или плохого поведения.
Функция ценности
Функция ценности предоставляет информацию о ситуации и действиях агента, а также о том, какое вознаграждение агент может получить. Функции вознаграждения указывают на немедленный сигнал о каждом хорошем или плохом действии, а функции ценности описывают будущие состояния и действия.
Модель
Обучение с подкреплением также включает в себя модель, которая имитирует поведение среды. Модель используется для организации, что означает, что она обеспечивает метод принятия плана действий, рассматривая все будущие ситуации, прежде чем на самом деле столкнуться с этими ситуациями.

Применения обучения с подкреплением

Беспилотные автомобили
автоматизация промышленности
Финансовый сектор
Медицинский домен
Система рекомендаций новостей
Обработка изображений

Пример
Мобильный робот для сбора мусора решает, следует ли ему войти в новую комнату в поисках большего количества мусора или начать искать способ вернуться к своей станции подзарядки аккумулятора. Это решение принимается на основе того, насколько быстро и легко ему удавалось найти подпитку в прошлом. Это можно сделать с помощью алгоритма обучения с подкреплением.

Применения машинного обучения

Распознавание изображений и речи.
Рекомендация продукта.
Анализ настроений.
Языковой перевод.
Чат-боты (виртуальные помощники).
Обнаружение мошенничества, спама.
Сортировка, тегирование, классификация фотографий.
Включение бизнес-аналитики.
Медицинский диагноз.
Самоуправляемые транспортные средства.

Спасибо за прочтение

Если вам нравится моя работа и вы хотите меня поддержать…

ЛУЧШИЙ способ поддержать меня — подписаться на меня на Medium здесь.
Следуйте за мной на GitHub здесь.
Подпишитесь на меня в LinkedIn здесь.
Будьте одним из ПЕРВЫХ, кто подпишется на меня в Instagram здесь.

Введение в машинное обучение

Контролируемое обучение:

Обучение без учителя:

Обучение с подкреплением:

Спасибо за прочтение

Вопросы по теме