«Компьютеры могут видеть, слышать и учиться. Добро пожаловать в будущее».
Определение:
- Машинное обучение — это изучение различных типов алгоритмов искусственного интеллекта, которые обеспечивают самообучение на основе данных без явного программирования.
- С помощью этой технологии компьютеры могут учиться сами по себе и улучшать свою точность и опыт с течением времени.
Цель:
- Основная цель ML — наблюдать за данной проблемой или набором данных, определять скрытые закономерности и взаимосвязи и извлекать детали / информацию, которые помогают в принятии решений на основе данных и дают представление.
В любом наборе данных есть некоторые термины, которые помогают нам при выборе подходящей модели машинного обучения.
В основном существует три типа обучения:
- Контролируемое обучение
- Неконтролируемое обучение
- Обучение с подкреплением
Контролируемое обучение:
- Тип машинного обучения, называемый обучением с учителем, использует предварительно размеченные данные для обучения машин или моделей, которые прогнозируют выходные данные на основе размеченных данных. Помеченные данные означают, что входные данные уже могут быть помечены желаемым результатом.
- Когда в заданном наборе данных есть функции, наблюдения и ответы, этот тип машинного обучения (под наблюдением) становится более точным и эффективным. Обучение с учителем также можно описать как обучение, ориентированное на выполнение задач. Эти типы алгоритмов предсказывают выходные данные для заданных новых данных/входных данных.
- При обучении с учителем цель состоит в том, чтобы найти функцию сопоставления, которая сопоставляет входные переменные (x) с выходными переменными (y).
- Реальные приложения контролируемого обучения включают оценку рисков, классификацию изображений, обнаружение мошенничества, фильтрацию спама и другие.
Работает:
Пример:
Предположим, у нас есть набор данных, который содержит количество часов обучения студентов, а также соответствующие проценты, которые они получили. Итак, мы можем сказать, что нам даны ввод/характеристики (часы) и вывод/метка/ответ (процент).
Это означает, что мы можем обучать нашу модель по часам и процентам. В целях тестирования мы можем взять новые данные в качестве входных данных, проверить соответствующие выходные данные и определить, являются ли они точными или нет.
Контролируемое машинное обучение также можно разделить на две группы
- Регрессия (используется, когда данные непрерывны):
Это оптимальный метод для выявления связи между зависимой и одной или несколькими зависимыми переменными. - Классификация (используется, когда данные являются категориальными):
Это метод контролируемого обучения, который используется для определения класса новых наблюдений на основе обучающих данных.
Он предсказывает категориальные метки, также называемые классами или категориями.
Этапы контролируемого обучения:
- Определите тип обучающего набора данных или определите область проблемы.
- Соберите данные в соответствии с вашими требованиями, которые должны соответствовать выбранному вами домену.
- Разделите собранные данные на данные для обучения, данные для тестирования и данные для проверки.
- Определите входные характеристики обучающего набора данных, которые должны иметь соответствующие знания, чтобы модель могла точно предсказать соответствующие выходные данные.
- Выберите подходящий алгоритм для вашей задачи и ваших данных.
- Примените алгоритм к обучающему набору данных. Иногда наборы проверки необходимы в качестве параметров управления.
- Набор тестов следует использовать для определения точности модели.
Алгоритмы контролируемого обучения:
- Линейная регрессия
- Логистическая регрессия
- Древо решений
- SVM (машина опорных векторов)
- Наивный Байес
- K-ближайшие соседи
- К-означает
- Случайный лес
- Алгоритмы уменьшения размерности
- Алгоритмы повышения градиента
Обобщение относится к способности вашей модели должным образом адаптироваться к новым, ранее неизвестным данным, взятым из того же распределения, которое использовалось для создания модели.
Обучение без учителя:
- Это тип машинного обучения, при котором модели обучаются с использованием немаркированного набора данных, такого как изображения, аудио, видео, рентгеновские снимки и т. д.
- Это оптимальная техника машинного обучения, в которой пользователю не нужно контролировать модель, вместо этого она позволяет модели работать и обнаруживать закономерности, поэтому ее называют самоорганизованным обучением.
- Неконтролируемое обучение выполняет более сложные задачи по сравнению с контролируемым обучением, но всегда существует проблема непредсказуемости модели.
- Основная цель неконтролируемого обучения — найти структуру данных и сгруппировать их в соответствии с их сходством и ассоциативностью, а также представить данные в более сжатом формате.
"Обучение без учителя – это тип машинного обучения, при котором модели обучаются с использованием немаркированного набора данных и могут работать с этими данными без какого-либо контроля".
Работает:
Неконтролируемое машинное обучение также можно разделить на две группы
- Кластеризация.
Простой способ группировки точек данных в различные кластеры. Объекты или точки, имеющие сходство, остаются в группе. - Ассоциация.
Правила ассоциации позволяют устанавливать ассоциации между объектами данных внутри больших наборов данных. Этот неконтролируемый метод предназначен для обнаружения интересных взаимосвязей между переменными в больших наборах данных. Например, люди, которые покупают новую машину, чаще всего покупают страховку.
Алгоритмы обучения без учителя:
- Кластеризация K-средних
- KNN (k-ближайшие соседи)
- Нейронные сети
- Априорный алгоритм
- Иерархическая кластеризация
- Обнаружение аномалий
- Анализ независимых компонентов
- Анализ основных компонентов
Обучение с подкреплением:
- Это метод машинного обучения на основе обратной связи, в котором агент учится вести себя в среде, выполняя действия и видя результаты действий. За хорошее действие агент получает положительную обратную связь, а за вялое действие агент получает отрицательную обратную связь или штраф.
- При обучении с подкреплением агент учится автоматически, используя обратную связь без каких-либо помеченных данных, в отличие от обучения с учителем. Агент взаимодействует непосредственно с окружающей средой и исследует ее самостоятельно.
- Основная цель обучения с подкреплением — повысить точность и производительность за счет получения максимальных положительных отзывов или вознаграждений.
«Обучение с подкреплением — это тип метода машинного обучения, при котором интеллектуальный агент или компьютерная программа взаимодействуют с окружающей средой и учатся действовать в ней».
- Обратная связь, которую агент получает после выполнения действия из среды, называется «Сигнал вознаграждения». Обучение с подкреплением (RL) связано с способностью изучать ассоциации между стимулами, действиями и возникновением приятных событий, называемых наградами, или неприятных событий, называемых наказаниями.
Термины, используемые в обучении с подкреплением
- Агент(): Сущность, которая может воспринимать окружающую среду и воздействовать на нее.
- Environment(): ситуация, в которой агент присутствует или находится в окружении.
- Action(): Действия — это действия, предпринимаемые агентом в среде.
- State(): состояние — это ситуация, возвращаемая средой после каждого действия, предпринятого агентом.
- Reward(): обратная связь, возвращаемая агенту из среды для оценки действия агента.
- Policy(). Политика — это стратегия, применяемая агентом для следующего действия в зависимости от текущего состояния.
- Value(): Ожидается, что долгосрочная перенастроена с коэффициентом дисконтирования и противоположна краткосрочному вознаграждению.
- Q-value(): в основном похож на значение, но принимает один дополнительный параметр в качестве текущего действия (а).
Элементы обучения с подкреплением
- Политика
Политика может быть определена как способ поведения агента в данный момент времени. Политика — это основной элемент RL, поскольку это единственное, что определяет поведение агента. - Функция/сигнал вознаграждения
Когда обучающийся агент переходит из одного состояния в другое, среда немедленно посылает сигнал, называемый сигналом вознаграждения. Агенты получают вознаграждение в зависимости от их хорошего или плохого поведения. - Функция ценности
Функция ценности предоставляет информацию о ситуации и действиях агента, а также о том, какое вознаграждение агент может получить. Функции вознаграждения указывают на немедленный сигнал о каждом хорошем или плохом действии, а функции ценности описывают будущие состояния и действия. - Модель
Обучение с подкреплением также включает в себя модель, которая имитирует поведение среды. Модель используется для организации, что означает, что она обеспечивает метод принятия плана действий, рассматривая все будущие ситуации, прежде чем на самом деле столкнуться с этими ситуациями.
Применения обучения с подкреплением
- Беспилотные автомобили
- автоматизация промышленности
- Финансовый сектор
- Медицинский домен
- Система рекомендаций новостей
- Обработка изображений
Пример
Мобильный робот для сбора мусора решает, следует ли ему войти в новую комнату в поисках большего количества мусора или начать искать способ вернуться к своей станции подзарядки аккумулятора. Это решение принимается на основе того, насколько быстро и легко ему удавалось найти подпитку в прошлом. Это можно сделать с помощью алгоритма обучения с подкреплением.
Применения машинного обучения
- Распознавание изображений и речи.
- Рекомендация продукта.
- Анализ настроений.
- Языковой перевод.
- Чат-боты (виртуальные помощники).
- Обнаружение мошенничества, спама.
- Сортировка, тегирование, классификация фотографий.
- Включение бизнес-аналитики.
- Медицинский диагноз.
- Самоуправляемые транспортные средства.
Спасибо за прочтение
Если вам нравится моя работа и вы хотите меня поддержать…