Здравствуйте, коллеги по учебе и читатели!
Я планировал опубликовать серию эпизодов о машинном обучении.
Поскольку я сам являюсь энтузиастом машинного обучения и практиком в области науки о данных, я хотел бы поделиться некоторыми своими выводами из что я собрал.
Читатели всегда приветствуются для исправления и обсуждения представленных тем. С нетерпением ждем здоровой среды машинного обучения!
Давайте копнем!

Машинное обучение — Это новое причудливое слово, возникшее как подмножество искусственного интеллекта. Я всегда думаю, почему это всегда называется Машинное обучение и искусственный интеллект, а не Машинный интеллект и искусственное обучение ? — ну, читатели, оставьте свою идею в разделе комментариев !

Давайте углубимся в некоторые основы.
Как только вы поймете бизнес-требования и соберете необходимые наборы данных для исследовательского анализа данных (EDA), (будет показывать это в другом параллельном эпизоде). Следование структуре CRISP_DM.
Следующий интересный этап — «Моделирование»
Моделирование использует алгоритмы машинного обучения, в которых машина учится на данных так же, каклюди учатся на своем «опыте».

Прежде чем перейти к описанию машинного обучения, давайте рассмотрим некоторые примеры из реальной жизни.

  • Вы когда-нибудь находили кучу писем в папке со спамом ? — 
    Подумайте, как они туда попали?
    Какой фрагмент кода мог решить / сгенерировать пометку, из-за которой конкретное электронное письмо стало спамом / веткой ?
  • Вы когда-нибудь пытались узнать цену продажи своего дома/собственности у брокера? —
    Обычно вам задают вопросы/или сами проводят опрос относительно:
    площади недвижимости, количества комнат, этажности и т.д..
    И с помощью этих данных пытаются предсказать продажная стоимость вашего дома.
    Предположим, вы хотите получить справедливую цену за свою недвижимость без влияния брокеров. Таким образом, вы воспользуетесь помощью запрограммированного веб-приложения для этого.
    Как это приложение предскажет цену?
  • Допустим, у вас есть фудтрак — (я бы однажды ! все время фудил)
    И вы хотели бы знать, где сделать подставку для фудтрака?
    Вы открываете карты и попробуй узнать местность.. Но это хороший способ?
    Нет ! без опроса о том, что любят есть люди в разных районах и каково приблизительное количество населения, которое может иметь ваш продукт? Это будет рискованным фактором для вашего грузовика с едой. Итак, вы можете подумать, как машина решит эту проблему?

Теперь позвольте мне сопоставить приведенные выше примеры с методами машинного обучения.
Фундаментально существуют две методологии обучения. Машинное обучение раздвоено:

Обучение с учителем . Во-первых, здесь будут прошлые записи/наборы данных. По сути, вы будете знать, что нужно выяснить из выходных данных.
Это далее делится на два метода обучения:
 — Алгоритм регрессионного обучения: он прогнозирует числовую/непрерывную выходную переменную — предсказывает цену вашей собственности.
Вы вводите в машину исторические данные о проданной недвижимости с вспомогательными данными, такими как количество комнат, количество этажей и т. д.
И машина пытается вычислить в этих данных некоторую закономерность, генерировать прогнозируемый вывод.

 — Алгоритм обучения классификации: он прогнозирует категориальный вывод — Что это значит? — Есть ли у вас электронное письмо со спамом ?
Итак, если вы думаете, что существуют определенные слова, которые делают электронное письмо спамом или ветчиной. Подумайте о таких словах, как — ["спешить", "последний шанс", "чувственный", "лотерея", "взрослый", "ПИН-код банкомата"]… что вы думаете ? Это ЛОВУШКА.
Итак, вы знаете, что если какое-либо из таких слов появляется в электронном письме, вы знаете, куда его отправить. Точно так же вы можете научить машину предоставить список таких спам-слов вместе с вашим собственным списком. Вы можете обучить свое приложение электронной почты, отправив несколько нежелательных писем в папку со спамом вручную. В следующий раз, если придет электронное письмо с похожим содержанием, вы найдете его в спаме. Теперь ваша машина знает, что делать !

Неконтролируемое обучение: для этого вы найдете соответствующие записи. Но вы не знаете, что это за спред/на что делятся данные? Как назвать данные?
Алгоритм кластерного обучения: ему не назначены предопределенные метки/понятия.
Он помогает формировать метки и группы/кластеры таких меток. .
— Помните свой фудтрак?
В этом случае вы не знаете, на какую область ориентироваться? Таким образом, вы получаете данные опроса людей, предпочитающих определенные категории продуктов питания, из разных мест. Теперь, в наибольшей степени относящейся к вашему продукту питания, вы наносите/обводите некоторые области, в которых ваш продукт, похожий на еду, больше всего нравится в этой области.
После определения областей вы определяете приблизительное количество людей, которым нравится продукт в этих областях. Конечно ! вы не пойдете туда, где 20% людей проявляют интерес к вашему продукту — в первую очередь для начала вашего бизнеса.
Таким образом, вы устанавливаете порог 70–80% . Итак, теперь из разброса вы округляете область, где у вас более 70–80% людей, которые, вероятно, будут иметь ваш продукт. И вы также группируете разные категории из своего фургона с едой, такие как гамбургеры, паста, пицца, доса и т. д.. Представьте, что вы проводите все эти исследования и статистику самостоятельно!
Теперь подумайте обо всем. это должна делать машина? — здесь машина проанализирует данные и вычислит, сколько людей любят бургеры в каком районе по карте. И это создаст кластер, формирующий ярлыки — гамбургеры, пицца, паста, доса и т. д. И на основе правил/ограничений, которые вы решаете, машина скажет вам, на какую область ориентироваться!

Ну, это было основное объяснение терминологии машинного обучения, которое я понял. В следующем эпизоде ​​я познакомлю вас с компонентами для построения модели машинного обучения и его технологического процесса!

А пока следите за обновлениями.. читать дальше.. узнавать больше..

Ешьте здоровую пищу, оставайтесь дома, берегите себя !
И всегда не стесняйтесь делиться своими мыслями с — Джесалом П.