Машинное обучение 🤖 — модное слово в наши дни и даже после бума chatGPT. Так что, если вы хотите растопить лед и научиться создавать свою самую первую модель машинного обучения, тогда этот пост для вас 🤓
Мы разберем этот замечательный пост/руководство на несколько частей, чтобы было проще понять, как создать нашу самую первую модель машинного обучения 🎉, и помните, что все источники и наборы данных будут доступны на GitHub.
⚠️ Для этого поста/туториала предполагается, что на них уже установлены такие инструменты, как Python и Jupyter Notebook ⚠️
Проблема 🤔
Наша модель машинного обучения должна будет предсказать тип транспортного средства, который хотел бы клиент, в зависимости от возраста и пола.
У нас есть следующий набор данных, в котором есть следующие столбцы:
- возраст
- пол
- тип машины
Как видите, мы можем определить для 20 years
старого female
(1) предпочтительный тип транспортного средства Supercar
🏎
Но в наборе данных нет предпочтений по типу транспортного средства для 22-летней женщины. И вот тут наша модель начинает действовать ⚡️, чтобы выполнить этот прогноз.
Практический 🚀
Изучение набора данных 🔍
Набор данных находится в формате CSV и имеет следующую схему:
- age (int) возраст клиента
- gender (int) пол клиента, 1 для женщин и 2 для мужчин
- vehicle_type (str), указывающий тип транспортного средства
Импорт библиотек 📦
Эти библиотеки потребуются для этой лаборатории.
import pandas as pd from sklearn.tree import DecisionTreeClassifier
Загрузите данные 🚚
Используя pandas, мы загрузим набор данных CSV в виде фрейма данных с именем cars_data
.
cars_data = pd.read_csv('cars.csv')
Разделите данные ✌️
Нам нужно разделить данные на два фрейма данных
X
для Входных данныхy
для Выходных данных
X = cars_data.drop(columns=['vehicle_type']).values # Imput Data y = cars_data['vehicle_type'] # Output Dat
⚠️ ПРИМЕЧАНИЕ. используйте .values
, чтобы избежать предупреждений sklearn "допустимое имя функции".
Создайте модель 🏗
Создается пустой объект модели, эта модель будет основана на Классификаторе дерева решений.
model = DecisionTreeClassifier()
Обучите модель 🏃
Время подготовиться и передать входные и выходные данные для обучения модели.
model.fit(X, y)
Делайте прогнозы 🔮
Давайте сделаем наш первый прогноз, чтобы увидеть результаты нашей лаборатории. Мы передадим в качестве параметров 22
возраст клиента и 1
пол клиента, в данном случае Женский.
predictions = model.predict([ [22,1] ]) predictions[0
Если ваш результат выглядит так, значит, пришло время отпраздновать 🍾 🎉 🎈вашу первую модель машинного обучения.
Выводы
В машинном обучении много сложных концепций 💥 и теории 📚, но на простых примерах (таких как эта лаборатория) эта сложность превращается в легкое понимание 🤓
Это основа для будущих постов/руководств по ML, так что следите за обновлениями, чтобы продолжать учиться 😉