Машинное обучение! Если вы знакомы с компьютерным миром, то в наши дни вы слышите этот термин довольно часто. Но что такое машинное обучение?

Что такое машинное обучение?

Термин машинное обучение популяризировал Артур Сэмюэл.

В 1959 году Артур Сэмюэл определил машинное обучение как «область обучения, которая дает компьютерам возможность учиться без явного программирования».

Том Митчелл определяет машинное обучение как:

«Считается, что компьютерная программа учится на опыте E в отношении некоторого класса задач T и показателя производительности P, если ее производительность при выполнении задач в T, измеренная с помощью P, улучшается с опытом E.»

Это некоторые формальные определения. Итак, что означает это определение? Позвольте привести пример.

В традиционной парадигме программирования для создания приложения вы пишете некоторый алгоритм для выполнения определенной задачи. Для простоты скажем, программа для вычисления квадрата заданного числа. Вы предоставляете ему данные (например, 2 в качестве входных). Программа дает вам результат, в данном случае 4. Вот как мы обычно пишем программу.
Но в машинном обучении мы предоставляем нашей программе данные и выходные данные, и программа автоматически изучает алгоритм. Удивительный!

Теперь, когда вы имеете некоторое представление о том, что такое машинное обучение, вам может быть интересно, какие алгоритмы используются в машинном обучении. По моему опыту новичка, было непонятно, с чего начать. Мир машинного обучения настолько обширен, что вы теряетесь, просто ища эти вещи. Это похоже на поиск книги в библиотеке, где книги хранятся в произвольном порядке.

Чтобы помочь вам, ребята, в этой ситуации, в этой статье рассказывается о 5 алгоритмах, которые должен знать каждый новичок, в произвольном порядке:

Линейная регрессия

Линейная регрессия - это алгоритм машинного обучения, основанный на обучении с учителем. Он выполняет задачу регрессии. Регрессия моделирует целевое значение прогноза, то есть значение зависимой переменной на основе независимых переменных.

Уравнение линейной регрессии, где y - зависимая переменная, а x - независимая переменная. Theta1 и theta2 - параметры уравнения.

Линейная регрессия используется, когда существует линейная связь между зависимой переменной и одной или несколькими независимыми переменными. Независимые переменные используются для прогнозирования значения зависимой переменной.

Приложение:

  1. Чтобы получить представление о поведении потребителей, понимании бизнеса и факторов, влияющих на прибыль
  2. Оценить риск в финансовой сфере
  3. Регрессия OLS может использоваться при анализе погодных данных. (Подробнее об этом здесь)
  4. Чтобы понять тенденции рынка
  5. Используется в наблюдательной астрономии.

Логистическая регрессия

Логистическая регрессия почти аналогична линейной регрессии. Логистическая регрессия используется, когда зависимая переменная является двоичной, а линейная регрессия используется, когда зависимая переменная является непрерывной.

Уравнение логистической регрессии, где y - зависимая переменная, x - независимая переменная, а e - число Эйлера.

Вышеупомянутое уравнение известно как логистическая функция или сигмовидная функция. Это S-образная кривая, которая принимает любое действительное число (в данном случае x) и отображает его в значение от 0 до 1, но никогда не находится точно в этих пределах. Давайте посмотрим на график сигмовидной функции.

Обратите внимание на следующие моменты на графике

  1. Если кривая уходит в положительную бесконечность, y становится равным 1.
  2. Если кривая уходит на отрицательную бесконечность, y становится равным 0.
  3. Все остальные значения сжаты между 0 и 1.

Логистическая регрессия предсказывает вероятность возникновения двоичного события с помощью сигмоидной функции.

заявка

  1. Гендерная классификация
  2. Прогнозировать смертность травмированных пациентов
  3. Прогнозировать риск развития данного заболевания (например, диабета, ишемической болезни сердца) на основе наблюдаемых характеристик пациента.
  4. Предсказать склонность клиента к покупке продукта или прекращению подписки
  5. Предсказать вероятность дефолта домовладельца по ипотеке.

Деревья решений

Дерево решений - это перевернутое дерево с корневым узлом наверху. Он состоит из трех основных частей; корневой узел, листовые узлы и ветви.

Определение дерева решений по Википедии

Дерево решений - это структура, подобная блок-схеме, в которой каждый внутренний узел представляет «тест» атрибута (например, выпадает ли подбрасывание монеты орлом или решкой), каждая ветвь представляет результат теста, а каждый листовой узел представляет собой метка класса (решение принимается после вычисления всех атрибутов). Пути от корня к листу представляют собой правила классификации.

Деревья решений - это простой, но мощный алгоритм машинного обучения для задач классификации и регрессии. Деревья решений также могут использоваться в задачах с несколькими выходами, и нелинейные отношения между параметрами не влияют на производительность дерева.

Чтобы узнать больше о дереве решений, я рекомендую вам посмотреть это видео о Дереве решений из StatQuest с Джошем Стармером.

заявка

  1. Гендерная классификация по заданному набору характеристик (например, возраст, рост, вес, телосложение и т. Д.)
  2. Идентификация доброкачественных и злокачественных раковых клеток.
  3. Определить вид животного
  4. Чтобы спрогнозировать цену дома по заданному набору характеристик (например, местоположению, размеру и т. Д.)
  5. Определение функций, которые будут использоваться в имплантируемых устройствах

Случайные леса

Случайные леса или леса случайных решений - это метод обучения ансамбля для классификации, регрессии и других задач, который работает путем построения множества деревьев решений во время обучения и вывода класса, который является режимом классов (классификация) или средним прогнозом (регрессия). отдельных деревьев. Они быстрые, гибкие и представляют собой надежный подход к добыче многомерных данных.

Случайные леса по сути представляют собой совокупность множества деревьев решений. Случайный лес обычно состоит из 30–130 деревьев, но это зависит от типа данных и постановки задачи.

Время выполнения случайного леса довольно короткое, и они довольно эффективно справляются с отсутствующими или неверными данными. Это один из наиболее часто используемых алгоритмов в соревнованиях по kaggle (если вы не знаете о kaggle, поищите его). Обратной стороной является то, что они могут перекрывать особенно шумные наборы данных.

заявка

  1. Обнаружение мошенничества с банковскими счетами, кредитной картой.
  2. Обнаружение аномалий
  3. Выявление данного заболевания у пациента путем анализа его медицинских карт.
  4. Прогнозировать стоимость дома с учетом набора характеристик

Машина опорных векторов (SVM)

В машинном обучении машины опорных векторов (SVM, а также сети опорных векторов) представляют собой контролируемые модели обучения со связанными алгоритмами обучения, которые анализируют данные, используемые для классификации и регрессионного анализа. По заданному набору обучающих примеров, каждый из которых помечен как принадлежащий к той или иной из двух категорий, алгоритм обучения SVM строит модель, которая присваивает новые примеры той или иной категории, что делает его не вероятностным двоичным линейным классификатором.

Идея SVM проста: создать линию или гиперплоскость, разделяющую данные на несколько классов. Хотя его можно использовать в задаче регрессии, в основном он используется для техники классификации.

Машина опорных векторов выполняет классификацию, находя гиперплоскость, которая максимизирует разницу между двумя классами. Векторы, определяющие гиперплоскость, называются опорными векторами.

Одним из преимуществ SVM является то, что помимо выполнения линейной классификации, он также может эффективно выполнять нелинейную классификацию с использованием уловки ядра, отображая входные данные в пространственные объекты большой размерности.

заявка

  1. Для классификации текста и гипертекста
  2. Классифицировать изображения
  3. Чтобы распознать рукописные цифры
  4. Классифицировать типы белков.
  5. Для анализа и моделирования геопространственных и пространственно-временных данных об окружающей среде.

Вы можете узнать об этих алгоритмах из StatQuest with Josh Starmer.

Спасибо за чтение! Надеюсь, вам понравилась эта статья. Дайте мне знать, если у вас возникнут вопросы. Удачного машинного обучения!