В этой статье мы рассмотрим проблему, решаемую этими двумя типами обучения в машинном обучении.

Контент, который мы рассмотрим:

Регрессия.

Классификация.

Кластеризация.

Ассоциация.

Это все типы проблем, которые может решить контролируемое и неконтролируемое машинное обучение.

Прежде чем мы начнем, нам нужно знать, что это за термины, чтобы понять это, вы можете обратиться к этой статье ниже, https://medium.com/@khanumerkus/let-us-understand-about-machine-learning-and- его-категории-88840448441

Теперь давайте начнем с темы дня, а именно, что может сделать этот тип обучения. Давайте посмотрим их один за другим.

контролируемое обучение

Как упоминалось в приведенной выше ссылке на статью, вы можете ознакомиться с тем, что такое обучение с учителем и обучение без учителя, но на данный момент поймите, что это способ обучения, который имеет помеченные данные (как функции, так и цель).

  • Регрессия
    Регрессия решает проблемы, в которых целевые переменные имеют непрерывный характер, в отличие от классификации, в которой целевая переменная имеет дискретный характер. Во многих случаях модель пытается найти линию регрессии и наилучшим образом соответствует ей. Модель проверяет корреляцию между функциями и целью, чтобы выяснить, какая функция более актуальна, чем другие. Функции — это столбцы со значениями, которые определяют целевую переменную в том смысле, что если функция изменяется в порядке x, то есть вероятность, что цель также получит изменение таким же образом. Корреляция определяет пропорциональность двух переменных, что также помогает в выборе признаков. Рассмотрим пример прогнозирования стоимости акций. В этой задаче можно использовать регрессию, если цена акции может дать линию регрессии. В этом случае модель будет прогнозировать цену акций на основе прошлых данных. Модель будет отслеживать прошлые данные, чтобы предсказать цену акций. Существует n алгоритмов, которые могут помочь решить такого рода проблемы, такие как линейная регрессия, регрессия дерева решений, регрессия случайного леса и многие другие. Мы рассмотрим эти алгоритмы, а также некоторые другие концепции, такие как регуляризация, в других статьях.
  • Классификация
    Классификация – это тип задачи анализа данных и машинного обучения, в которой извлекаются модели, определяющие соответствующие классы данных. Классы содержат метки классов, которые могут быть двоичного, порядкового или другого категориального типа. Модель — это то, что обучается на наборе данных (обучение), учится на точках данных и извлекает знания из данных. Модели классификации называются классификаторами, которые предсказывают метку класса после изучения данных. Этот тип моделей дает ответы либо на вопросы «да/нет», либо на вопросы «то/то». Например, выдать кредит человеку на основании переданных им данных, диагностировано ли у человека то или иное заболевание или нет, и многие другие вопросы, на которые нужно ответить тем или иным вариантом. Существует n номеров алгоритмов, которые мы можем использовать для решения задач такого типа. Например, классификатор дерева решений, классификатор случайного леса, логистическая регрессия и многие другие. Мы разберемся в алгоритмах классификации в какой-нибудь другой статье и в более глубоких понятиях, таких как бэггинг, повышение и гиперпараметры этих алгоритмов.

Неконтролируемое обучение.

Неконтролируемое обучение - это способ обучения, при котором данные не помечаются, а проверяются сходства в точках данных и группировка элементов.

  • Кластеризация
    Кластеризация — еще один тип проблем, которые можно решить с помощью обучения без учителя. Этот тип проблем не имеет каких-либо целей в наборе данных. Кластер, который представляет собой группу похожих точек данных в одной группе. Точка из одного кластера не похожа на другую точку из другого кластера. На основе сходства точек данных формируется формирование кластера. Этот тип моделей может решать такие проблемы, как сегментация рынка, сегментация изображений, сегментация настроений и даже обнаружение выбросов, то есть обнаружение выбросов путем группировки этой точки, отличной от большинства точек в наборе данных, путем их группировки в одну. Этот подход группирует данные и присваивает им некоторые ярлыки, такие как группа 1, группа 2, ... и т. д. Существует n алгоритмов для решения задач такого типа, таких как KMeans, KMediods, агломеративная кластеризация и т. д. Мы также увидим эти алгоритмы в некоторых других статьях. Давайте поймем это более правильно, используя анекдот из реального мира. Компания хочет запустить продукт на рынок, но перед запуском компания хочет проанализировать своих клиентов на основе имеющихся у них данных. Используя кластеризацию, они могут создавать группы клиентов и запускать продукт на рынок, ориентируясь на желаемого клиента, что будет для них очень выгодно, например, автомобильная компания хочет выпустить на рынок автомобиль стоимостью 100 000 долларов, но не для всех клиентов. в рыночном мире будут покупать это для рекламы, они могут использовать электронную почту, обмен сообщениями или какую-либо другую форму только для тех клиентов, которые могут себе это позволить, экономя много усилий компании.
  • Ассоциация
    В ассоциации основное внимание уделяется анализу потребительской корзины, частому шаблону, правилам ассоциации. Это дает решение этих проблем, предоставляя рекомендации, основанные на поведении клиента. Анализ рыночной корзины также используется гигантскими технологическими ТНК, такими как Amazon, Netflix и многими другими. Эти компании используют это для рекомендаций пользователям, которые приносят большую прибыль компаниям. Он также используется в магазинах и продуктовых магазинах для предоставления соответствующих комбинаций продуктов с использованием правил ассоциации. Существуют даже определенные алгоритмы для поиска решений такого рода задач, такие как Apriori, дерево роста FP и другие.

Заключение
В этой статье мы рассмотрели проблему, которую может решить обучение с учителем и без учителя, с некоторыми примерами и доступными алгоритмами для решения такого рода проблем.

Примечание. Sklearn (сокращение от SciKitLearn) — это библиотека машинного обучения, которая предоставляет n алгоритмов для различных типов решения задач машинного обучения, мощный инструмент, бесплатный и открытый для всех. Мы увидим об этом в других статьях о том, как использовать, разбивая набор данных на обучение и тестирование, проверку и оценку.

Приветствуются все желающие оставить отзыв, используя комментарии к каждой моей статье, так как будет легче сделать хороший контент, чем предыдущий, и понять ошибки и ловушки в моем письме.