Дерево решений — это один из интеллектуальных методов из многих методов машинного обучения. Он показывает вам, как идентифицировать категории на основе ценности с видимыми и поэтапными решениями, а глубину сцены можно настраивать.

Чем глубже вы проходите, тем сложнее и конкретнее это становится.

Я покажу, как это сделать.

Допустим, у нас есть набор данных, в этом случае мы будем использовать набор данных о человеческих ресурсах. И вопрос:

"Как этот метод машинного обучения предсказывает, какой работодатель ушел из компании и почему?"

Мы получаем эти данные выше, так как значения столбцов «продажи» и «зарплата» являются строковыми, мы изменили их на числовое значение.

Теперь мы должны сделать это с библиотеками ONE HOT ENCODER.

Сначала мы создаем список, содержащий уникальное значение для каждого столбца.

Затем измените их на массив.

Затем переходим к колонке «Зарплата».

Как видите, мы можем прочитать значение после того, как изменили значение типа объекта из его столбца. Итак, что нам нужно сделать, это заполнить их новыми столбцами в зависимости от их уникального значения.

Создадим новые столбцы

И это произойдет:

После этого мы должны сделать новый набор данных. Мы копируем их, почему? Во славу сатаны конечно!

Просто шучу.

Потому что мы хотим сохранить исходный набор данных в безопасности, поскольку он находится на первом месте, на случай, если произойдут какие-то ошибки. Итак, мы должны клонировать его.

А затем, давайте углубимся. Мы определяем цель и предиктор.

На этом этапе df_x представляет собой набор значений, а столбцы содержат символы работодателей, а df_y становится результатом работодателей, покинувших компанию. Теперь импортируйте библиотеку.

А затем напишите несколько заклинаний в своей волшебной книге:

Затем импортируйте некоторые библиотеки и напишите, какие столбцы вы хотите обработать.

Вот оно, Волшебство:

Ааааааа и БУМ!

Как видите, на каждом этапе есть своя причина, по которой машинное обучение решает, кто уходит, а кто остается. Синяя ячейка для работодателей, которые останутся, и оранжевая для работодателей останутся.

Есть четыре этапа, и чем глубже вы копаете, тем более конкретную информацию вы получаете в качестве причин, по которым решается это машинное обучение.

Это все люди. Я снова отправлюсь в приключение и вернусь за тобой, чтобы рассказать еще одну историю.

(Автор использует спелл-карту телепорта)

(Автор оставил костер авантюриста)

Чтобы получить больше информации :

https://github.com/gita87/machine-learning/blob/main/exe_Machine_Learning_Comparisons.ipynb