Машинное обучение 🤖 — модное слово в наши дни и даже после бума chatGPT. Так что, если вы хотите растопить лед и научиться создавать свою самую первую модель машинного обучения, тогда этот пост для вас 🤓

Мы разберем этот замечательный пост/руководство на несколько частей, чтобы было проще понять, как создать нашу самую первую модель машинного обучения 🎉, и помните, что все источники и наборы данных будут доступны на GitHub.

⚠️ Для этого поста/туториала предполагается, что на них уже установлены такие инструменты, как Python и Jupyter Notebook ⚠️

Проблема 🤔

Наша модель машинного обучения должна будет предсказать тип транспортного средства, который хотел бы клиент, в зависимости от возраста и пола.

У нас есть следующий набор данных, в котором есть следующие столбцы:

  • возраст
  • пол
  • тип машины

Как видите, мы можем определить для 20 years старого female(1) предпочтительный тип транспортного средства Supercar 🏎

Но в наборе данных нет предпочтений по типу транспортного средства для 22-летней женщины. И вот тут наша модель начинает действовать ⚡️, чтобы выполнить этот прогноз.

Практический 🚀

Изучение набора данных 🔍

Набор данных находится в формате CSV и имеет следующую схему:

  • age (int) возраст клиента
  • gender (int) пол клиента, 1 для женщин и 2 для мужчин
  • vehicle_type (str), указывающий тип транспортного средства

Импорт библиотек 📦

Эти библиотеки потребуются для этой лаборатории.

import pandas as pd
from sklearn.tree import DecisionTreeClassifier

Загрузите данные 🚚

Используя pandas, мы загрузим набор данных CSV в виде фрейма данных с именем cars_data.

cars_data = pd.read_csv('cars.csv')

Разделите данные ✌️

Нам нужно разделить данные на два фрейма данных

  • X для Входных данных
  • y для Выходных данных
X = cars_data.drop(columns=['vehicle_type']).values # Imput Data

y = cars_data['vehicle_type'] # Output Dat

⚠️ ПРИМЕЧАНИЕ. используйте .values, чтобы избежать предупреждений sklearn "допустимое имя функции".

Создайте модель 🏗

Создается пустой объект модели, эта модель будет основана на Классификаторе дерева решений.

model = DecisionTreeClassifier()

Обучите модель 🏃

Время подготовиться и передать входные и выходные данные для обучения модели.

model.fit(X, y)

Делайте прогнозы 🔮

Давайте сделаем наш первый прогноз, чтобы увидеть результаты нашей лаборатории. Мы передадим в качестве параметров 22 возраст клиента и 1 пол клиента, в данном случае Женский.

predictions = model.predict([ [22,1] ])
predictions[0

Если ваш результат выглядит так, значит, пришло время отпраздновать 🍾 🎉 🎈вашу первую модель машинного обучения.

Выводы

В машинном обучении много сложных концепций 💥 и теории 📚, но на простых примерах (таких как эта лаборатория) эта сложность превращается в легкое понимание 🤓

Это основа для будущих постов/руководств по ML, так что следите за обновлениями, чтобы продолжать учиться 😉