Аюшри Бхуян, группа по контенту, Клуб науки о данных, VIT-B

«Машинное обучение: компьютер может учиться на собственном опыте без специального программирования».

Что такое машинное обучение?

Машинное обучение определяется как часть информатики, которая занимается искусственным интеллектом и фокусируется на использовании данных и алгоритмов, чтобы предположить, как люди учатся. Проще говоря, это процесс обучения компьютеров без участия человека. ML считается одной из самых захватывающих технологий, с которыми можно столкнуться.

Три основных аспекта машинного обучения включают:

1. Задача: это основная проблема, связанная с прогнозами, оценками и т. д.

2. Опыт: это обучение, которое он получает из прошлых данных или статистики и используется для прогнозирования будущих задач или решения проблем.

3. Производительность: машина может решать любые задачи или проблемы машинного обучения и давать наилучший результат. Кроме того, это зависит и от проблем.

Методы машинного обучения:

В целом существует 4 различных категории методов машинного обучения:

1.Контролируемое обучение

Это удобно, когда машине предоставлены образцы данных и соответствующие этикетки. Правильные метки используются для проверки точности модели с помощью меток. Это помогает предсказывать будущие события с помощью прошлого опыта и предоставленных ярлыков. Каждый входной шаблон используется для обучения уважаемой модели. Процесс обучения основан на сравнении выходных данных компьютерной сети с правильными ожидаемыми выходными данными. Сначала он анализирует предоставленные данные, а затем вводит функцию для прогнозирования вывода. Он также может прогнозировать ошибки в течение всего процесса и устранять их с помощью определенных алгоритмов.

2. Обучение без учителя

Это когда даются только данные, а не метки. Данные обучения не классифицируются и не маркируются. Таким образом, нет никакой гарантии, что данный вывод правильный или нет. Этот метод помогает проверять данные и делать прогнозы для объяснения структур на основе немаркированных данных. Неконтролируемое обучение обычно используется для транзакционных данных.

3. Полуконтролируемое обучение

Предлагаются только некоторые из меток, а остальные состоят из неразмеченных данных в большом количестве. Следовательно, это также снижает стоимость модели машинного обучения, поскольку метки обходятся дорого, но для корпоративных целей у нее может быть несколько меток. Кроме того, это также повышает точность и производительность модели машинного обучения. Этот метод полезен для ученых, чтобы преодолеть недостатки контролируемого и неконтролируемого обучения.

4. Обучение с подкреплением

Это техника, основанная на обратной связи. Здесь агенты (как правило, компьютерные программы) должны исследовать мир или взаимодействовать с ним, чтобы делать наблюдения, а затем предпринимать соответствующие действия. За каждый хороший поступок он получает награду, а за каждый плохой поступок наказывается. Он должен научиться выбирать действия таким образом, чтобы получить максимальную награду.

Алгоритмы машинного обучения:

Вот список наиболее часто используемых алгоритмов машинного обучения:

• Линейная регрессия

• Логистическая регрессия

• K ближайшего соседа (KNN)

• Древо решений

• K- означает кластеризацию

• Наивный Байес

• Метод опорных векторов (SVM)

Теперь поговорим о некоторых алгоритмах.

Линейная регрессия:

Это самый простой и популярный алгоритм в машинном обучении. Он пытается смоделировать взаимосвязь между двумя переменными, находя линейное уравнение для наблюдаемых данных. Здесь мы устанавливаем связь между независимыми и зависимыми переменными, подбирая наилучшую линию. Эта линия наилучшего соответствия известна как линия регрессии и представлена ​​линейным уравнением Y = a * X + b. Здесь X — независимая переменная или переменная-предиктор, а Y — зависимая переменная или переменная отклика, b — точка пересечения линии, а a — наклон линии, который является одной из наиболее важных величин в любом линейном регрессионном анализе. Значение, очень близкое к 0, обычно указывает на небольшую связь или ее полное отсутствие, тогда как положительные и отрицательные значения указывают на положительную и отрицательную связь.

Типы линейной регрессии:

• Простая линейная регрессия

• Множественная линейная регрессия

Этот алгоритм полезен при оценке заработной платы, прогнозировании урожая и т. д.

2. Логистическая регрессия:

Он используется для оценки дискретных значений на основе предоставленного набора независимых переменных. Проще говоря, он предсказывает возникновение события, упорядочивая данные в виде логической функции. Его выходные данные находятся между 0 и 1. Логистическую регрессию можно выразить в виде «S-образной кривой», называемой сигмовидной функцией.

Типы логистической регрессии:

• Биномиальный

• Полиномиальный

• Порядковый номер

3. K Ближайший сосед (KNN):

Этот алгоритм подпадает под контролируемые методы обучения. Его можно применять как для классификации, так и для задач регрессии. Этот алгоритм хранит все доступные случаи и упорядочивает новые наблюдения, голосуя от своих K соседей. Это измеряется функцией расстояния, которая может быть евклидовой, манхэттенской, минковской и Хэмминговой, где первые три являются непрерывными, а четвертая - для категорий. Этот алгоритм предполагает наличие связи между новыми доступными данными, а затем упорядочивает их по категориям. Его также называют алгоритмом ленивого ученика, поскольку он не учится напрямую на уже имеющихся данных.

4. Дерево решений:

Этот алгоритм также подпадает под контролируемое обучение. Подобно KNN, он также решает проблемы классификации и регрессии. Само название говорит о том, что у него древовидный классификатор, который далее состоит из внутренних узлов, решающие правила представлены ветвями, а лист показывает результат. Дерево начинается с корневого узла и заканчивается конечным узлом.

Применения машинного обучения:

➢ Социальные сети:

Платформы социальных сетей используют алгоритмы машинного обучения для создания функций, которые приятны и привлекательны для пользователей. Например, Instagram — одна из самых популярных социальных сетей. Он имеет такие функции, как чаты, ролики, лайки, комментарии и т. д. Он отслеживает время, которое мы тратим на определенные виды сообщений. Машинное обучение изучает и использует наш опыт, чтобы предлагать друзей и публикации для нашего профиля.

➢ Распознавание изображений:

Это подход к обнаружению функции или объекта на изображении. Он считается одним из наиболее важных методов машинного обучения и искусственного интеллекта. Этот метод в дальнейшем применяется для обнаружения лиц, распознавания и т. д.

➢ Рекомендации по продуктам:

Это одно из самых популярных приложений машинного обучения. Просматривая историю покупок клиента и инвентарь продуктов, определяя продукты, которые клиент был бы заинтересован в покупке. Большинство сайтов электронной коммерции используют этот алгоритм и дают рекомендации по продуктам.

➢ Медицинский диагноз:

В этом очень помогает применение ИИ, учитывая симптомы, видимые у пациента, и базу данных проанализированных пациентов, а затем предсказывает, страдает ли пациент определенными заболеваниями или нет.

➢ Обнаружение спама:

ML распознает, какие сообщения электронной почты являются спамом, и отправляет их в раздел спама. Он может классифицировать электронные письма, не являющиеся спамом, или спам. Наличие модели ML решает эту проблему.