Краткая история машинного обучения!

Что такое машинное обучение?

  • С самого начала целью было создать машину, которая могла бы думать и учиться как человек.
  • Не будучи явно запрограммированными, методы машинного обучения позволяют компьютерам учиться на данных и даже совершенствовать себя.

Что такое машинное обучение простыми словами?

Когда вы объединяете навыки компьютерного программирования со статистикой, в результате получается область обучения, известная как машинное обучение.

Когда мы используем машинное обучение?

Показано, что машинное обучение улучшает и приносит изменения в различных областях. Неважно, какая это отрасль, от фермерства до космонавтики.

Примеры использования машинного обучения:

  • Человеческий опыт не существует (навигация по Марсу)
  • Люди не могут объяснить свой опыт (распознавание речи)
  • Модели должны быть настроены (персонализированная медицина)
  • Модели основаны на огромном количестве данных (геномика)

Как работает машинное обучение?

Этапы машинного обучения

Есть четыре шага:

  • Подготовка данных.Процесс очистки и изменения необработанных данных перед обработкой и анализом называется подготовкой данных. Это важный этап перед обработкой, которая часто включает переформатирование данных, внесение изменений в данные и интеграцию наборов данных для обогащения данных.
  • Разработка признаков.Выбор, изменение и преобразование необработанных данных в функции, которые можно использовать в контролируемом обучении, называется разработкой признаков. Возможно, потребуется создать и обучить более совершенные функции, чтобы машинное обучение хорошо справлялось с новыми задачами.
  • Моделирование данных.Моделирование данных — это практика использования слов и символов для представления данных и их потоков в упрощенном представлении программной системы и содержащихся в ней фрагментов данных. Модели данных служат дорожной картой для создания новой базы данных или реинжиниринга существующей.
  • Производительность.Производительность модели машинного обучения относительна, и мысли о том, какую оценку может получить хорошая модель, имеют смысл только в контексте оценки навыков. других моделей, обученных на тех же данных.

Какие существуют типы машинного обучения?

Существует три основных типа машинного обучения:

  • Обучение с учителем. Упражнения на алгоритме — хороший способ изучить его. Выход должен быть y, если вход X. (Целевая переменная). Для этого используются линейная регрессия, логистическая регрессия, деревья решений, случайные леса, SVM, наивный Байес, XGboost, AdaBoost и другие распространенные методы.
  • Неконтролируемое машинное обучение: Целевая переменная отсутствует. Другими словами, у вас нет данных, указывающих на то, что вход — это X, а результат — y. В этом случае важные шаблоны могут быть извлечены из данных немедленно, например, путем кластеризации строк одинакового типа (кластеризация), без каких-либо предварительных знаний о данных. K-Means, DBSCAN, PCA, ICA и Apriori — некоторые распространенные алгоритмы.
  • Подкрепление ML: когда алгоритм машинного обучения учится на своих ошибках и совершенствуется, чтобы достичь цели в следующей итерации. Монте-Карло, Q-Learning и SARSA — три распространенных алгоритма.

Каковы различные типы контролируемого машинного обучения?

Существует два разных типа контролируемых алгоритмов машинного обучения:

  • Регрессия
  • Классификация

  • Регрессия. При прогнозировании непрерывных чисел, таких как "Продажи", "Прибыль", "Спрос", "Оборот", "Объемы", "Количество посетителей" и т. д., вы используете контролируемую машину. обучение. Это концепция регрессии.
  • Классификация. Когда вы прогнозируете категориальное/дискретное значение, такое как «0/1», «Да/Нет», «Хорошо/Плохо», «Серебро/Золото/Платина» и т. д. Это Классификация.
  • Существуют различные алгоритмы, используемые в машинном обучении с учителем, и я перечислил здесь несколько наиболее известных из них.

Каковы различные типы неконтролируемого машинного обучения?

Существует три различных типа алгоритмов машинного обучения без учителя:

  • Кластеризация
  • Уменьшение размерности
  • Ассоциация

  • Кластеризация: объединение групп связанных строк. Цель состоит в том, чтобы сгруппировать все строки данных одного типа в один кластер/группу. K-средние, иерархическая кластеризация, DBSCAN и OPTICS — все это полезные методы кластеризации.
  • Уменьшение параметров. Объединив сопоставимые столбцы предикторов в один столбец, вы можете уменьшить количество столбцов предикторов в ваших данных. Уменьшение размера - термин для этой процедуры. Поскольку каждое измерение в ваших данных представлено столбцом, эффективность прогностических моделей с точки зрения скорости и точности снижается, когда данные имеют большую размерность (например, 800 столбцов). В результате было бы замечательно, если бы мы могли сократить эти 800 столбцов до 10–15 столбцов, представляющих те же шаблоны, что и все 800 столбцов. PCA, ICA, T-SNA и UMAP — это некоторые из алгоритмов, используемых для уменьшения размерности.
  • Ассоциация. Анализ правил ассоциации чаще всего используется для определения того, какие товары хорошо продаются вместе. Чтобы понять ассоциации, разрабатываются правила путем подсчета элементов транзакций и расчета показателей поддержки, уверенности и подъема. Проще говоря, насколько вероятно, что пользователь купит товар Б, если он купит товар А? Алгоритмы Apriori, Eclat и FP-Growth используются для поиска ассоциаций.

Каковы различные типы обучения с подкреплением?

  • Обучение с подкреплением — это тип машинного обучения, при котором алгоритмы учатся, делая ошибки и совершенствуясь на следующей итерации.
  • Основная идея состоит в том, чтобы дать вознаграждение (один балл), если алгоритм сделает правильный шаг, и наказание (один балл), если программа сделает неправильный шаг. Это почти как если бы вы тренировали юношу! Однако в этом случае вы не наблюдаете за обучением; вместо этого вы просто описываете награды и наказания, а затем оставляете алгоритм работать сам по себе, получая обратную связь.

Некоторые из алгоритмов, используемых для обучения с подкреплением:

  • Монте-Карло
  • Q-обучение
  • SARSA (Состояние-Действие-Награда-Состояние-Действие)

Вышеизложенное представляет собой обзор основ машинного обучения, которые следует понять, прежде чем углубляться. Я продолжу писать статьи, которые постепенно расскажут нам о многих идеях машинного обучения.

Надеюсь, это поможет :) Подпишитесь, если вам нравятся мои публикации. Давайте свяжемся вLinkedIn.

Приятного обучения 😃