Python — это язык программирования общего назначения, который занимает особое место в работе каждого специалиста по данным. Он имеет огромные пакеты инструментов обработки данных, которые могут помочь им решить проблему.

Классификация — это общая проблема, которую можно решить с помощью данных. Цель состоит в том, чтобы вы могли сделать прогноз с некоторыми заданными данными. Вот схема процесса классификации.

Первое, что нужно сделать, это определить, какие классы будут предсказаны в качестве выходных данных, и какие функции мы используем в качестве входных данных. В качестве примера я предскажу, страдает ли кто-то ожирением или нет, с данными о возрасте, весе и росте.

Затем мы можем начать использовать Scikit-learn для создания нашей модели прогнозирования. Вы должны убедиться, что Python работает на вашем компьютере. Нам также нужен pip для получения наших зависимостей. После того, как вы выполнили установку pip, вы можете получить зависимость Scikit-learn, numpy и scipy с помощью следующего кода.

pip install -U scikit-learn
pip install numpy
pip install scipy

В Scikit-learn есть много моделей машинного обучения для классификации данных, но теперь мы используем Дерево решений. Чтобы реализовать классификатор, создайте файл Python и добавьте код со следующей инструкцией.

во-первых, импортируйте модель дерева решений из Scikit-learn.

from sklearn import tree 

Затем создайте пары входных данных и метки в качестве обучающих данных.

#[age, weight, height]
input = [[20,61.2,165.0], [15,49.2,144.3], [23,62.6,150.0]]
#obese (yes,no)
label = ['no', 'no', 'yes']

После этого инициализируйте классификатор дерева решений и обучите данные.

classifier = tree.DecisionTreeClassifier()
classifier = classifier.fit(input, label)

Наконец, вы можете протестировать свою модель, чтобы предсказать другой ввод данных.

prediction = classifier.predict([[31,89.0,155.2]])
print(prediction)

Точность результата зависит от обучающих данных. Для создания более точной модели требуется много точных обучающих данных, поэтому вы можете попытаться обучить свою модель, соответствующую вашей проблеме.

Поздравляем, вы создали простой классификатор Python с помощью Scikit-learn. Я почти уверен, что это может помочь вам понять основы классификации. Удачи.