Машинное обучение: концепции, которые необходимо знать, чтобы начать работу с ML

Краткая история машинного обучения!

Что такое машинное обучение?

С самого начала целью было создать машину, которая могла бы думать и учиться как человек.
Не будучи явно запрограммированными, методы машинного обучения позволяют компьютерам учиться на данных и даже совершенствовать себя.

Что такое машинное обучение простыми словами?

Когда вы объединяете навыки компьютерного программирования со статистикой, в результате получается область обучения, известная как машинное обучение.

Когда мы используем машинное обучение?

Показано, что машинное обучение улучшает и приносит изменения в различных областях. Неважно, какая это отрасль, от фермерства до космонавтики.

Примеры использования машинного обучения:

Человеческий опыт не существует (навигация по Марсу)
Люди не могут объяснить свой опыт (распознавание речи)
Модели должны быть настроены (персонализированная медицина)
Модели основаны на огромном количестве данных (геномика)

Как работает машинное обучение?

Этапы машинного обучения

Есть четыре шага:

Подготовка данных.Процесс очистки и изменения необработанных данных перед обработкой и анализом называется подготовкой данных. Это важный этап перед обработкой, которая часто включает переформатирование данных, внесение изменений в данные и интеграцию наборов данных для обогащения данных.
Разработка признаков.Выбор, изменение и преобразование необработанных данных в функции, которые можно использовать в контролируемом обучении, называется разработкой признаков. Возможно, потребуется создать и обучить более совершенные функции, чтобы машинное обучение хорошо справлялось с новыми задачами.
Моделирование данных.Моделирование данных — это практика использования слов и символов для представления данных и их потоков в упрощенном представлении программной системы и содержащихся в ней фрагментов данных. Модели данных служат дорожной картой для создания новой базы данных или реинжиниринга существующей.
Производительность.Производительность модели машинного обучения относительна, и мысли о том, какую оценку может получить хорошая модель, имеют смысл только в контексте оценки навыков. других моделей, обученных на тех же данных.

Какие существуют типы машинного обучения?

Существует три основных типа машинного обучения:

Обучение с учителем. Упражнения на алгоритме — хороший способ изучить его. Выход должен быть y, если вход X. (Целевая переменная). Для этого используются линейная регрессия, логистическая регрессия, деревья решений, случайные леса, SVM, наивный Байес, XGboost, AdaBoost и другие распространенные методы.
Неконтролируемое машинное обучение: Целевая переменная отсутствует. Другими словами, у вас нет данных, указывающих на то, что вход — это X, а результат — y. В этом случае важные шаблоны могут быть извлечены из данных немедленно, например, путем кластеризации строк одинакового типа (кластеризация), без каких-либо предварительных знаний о данных. K-Means, DBSCAN, PCA, ICA и Apriori — некоторые распространенные алгоритмы.
Подкрепление ML: когда алгоритм машинного обучения учится на своих ошибках и совершенствуется, чтобы достичь цели в следующей итерации. Монте-Карло, Q-Learning и SARSA — три распространенных алгоритма.

Каковы различные типы контролируемого машинного обучения?

Существует два разных типа контролируемых алгоритмов машинного обучения:

Регрессия
Классификация

Регрессия. При прогнозировании непрерывных чисел, таких как "Продажи", "Прибыль", "Спрос", "Оборот", "Объемы", "Количество посетителей" и т. д., вы используете контролируемую машину. обучение. Это концепция регрессии.
Классификация. Когда вы прогнозируете категориальное/дискретное значение, такое как «0/1», «Да/Нет», «Хорошо/Плохо», «Серебро/Золото/Платина» и т. д. Это Классификация.
Существуют различные алгоритмы, используемые в машинном обучении с учителем, и я перечислил здесь несколько наиболее известных из них.

Каковы различные типы неконтролируемого машинного обучения?

Существует три различных типа алгоритмов машинного обучения без учителя:

Кластеризация
Уменьшение размерности
Ассоциация

Кластеризация: объединение групп связанных строк. Цель состоит в том, чтобы сгруппировать все строки данных одного типа в один кластер/группу. K-средние, иерархическая кластеризация, DBSCAN и OPTICS — все это полезные методы кластеризации.
Уменьшение параметров. Объединив сопоставимые столбцы предикторов в один столбец, вы можете уменьшить количество столбцов предикторов в ваших данных. Уменьшение размера - термин для этой процедуры. Поскольку каждое измерение в ваших данных представлено столбцом, эффективность прогностических моделей с точки зрения скорости и точности снижается, когда данные имеют большую размерность (например, 800 столбцов). В результате было бы замечательно, если бы мы могли сократить эти 800 столбцов до 10–15 столбцов, представляющих те же шаблоны, что и все 800 столбцов. PCA, ICA, T-SNA и UMAP — это некоторые из алгоритмов, используемых для уменьшения размерности.
Ассоциация. Анализ правил ассоциации чаще всего используется для определения того, какие товары хорошо продаются вместе. Чтобы понять ассоциации, разрабатываются правила путем подсчета элементов транзакций и расчета показателей поддержки, уверенности и подъема. Проще говоря, насколько вероятно, что пользователь купит товар Б, если он купит товар А? Алгоритмы Apriori, Eclat и FP-Growth используются для поиска ассоциаций.

Каковы различные типы обучения с подкреплением?

Обучение с подкреплением — это тип машинного обучения, при котором алгоритмы учатся, делая ошибки и совершенствуясь на следующей итерации.
Основная идея состоит в том, чтобы дать вознаграждение (один балл), если алгоритм сделает правильный шаг, и наказание (один балл), если программа сделает неправильный шаг. Это почти как если бы вы тренировали юношу! Однако в этом случае вы не наблюдаете за обучением; вместо этого вы просто описываете награды и наказания, а затем оставляете алгоритм работать сам по себе, получая обратную связь.

Некоторые из алгоритмов, используемых для обучения с подкреплением:

Монте-Карло
Q-обучение
SARSA (Состояние-Действие-Награда-Состояние-Действие)

Вышеизложенное представляет собой обзор основ машинного обучения, которые следует понять, прежде чем углубляться. Я продолжу писать статьи, которые постепенно расскажут нам о многих идеях машинного обучения.

Надеюсь, это поможет :) Подпишитесь, если вам нравятся мои публикации. Давайте свяжемся вLinkedIn.

Приятного обучения 😃

Машинное обучение: концепции, которые необходимо знать, чтобы начать работу с ML

Вопросы по теме