Дерево решений — это один из интеллектуальных методов из многих методов машинного обучения. Он показывает вам, как идентифицировать категории на основе ценности с видимыми и поэтапными решениями, а глубину сцены можно настраивать.
Чем глубже вы проходите, тем сложнее и конкретнее это становится.
Я покажу, как это сделать.
Допустим, у нас есть набор данных, в этом случае мы будем использовать набор данных о человеческих ресурсах. И вопрос:
"Как этот метод машинного обучения предсказывает, какой работодатель ушел из компании и почему?"
Мы получаем эти данные выше, так как значения столбцов «продажи» и «зарплата» являются строковыми, мы изменили их на числовое значение.
Теперь мы должны сделать это с библиотеками ONE HOT ENCODER.
Сначала мы создаем список, содержащий уникальное значение для каждого столбца.
Затем измените их на массив.
Затем переходим к колонке «Зарплата».
Как видите, мы можем прочитать значение после того, как изменили значение типа объекта из его столбца. Итак, что нам нужно сделать, это заполнить их новыми столбцами в зависимости от их уникального значения.
Создадим новые столбцы
И это произойдет:
После этого мы должны сделать новый набор данных. Мы копируем их, почему? Во славу сатаны конечно!
Просто шучу.
Потому что мы хотим сохранить исходный набор данных в безопасности, поскольку он находится на первом месте, на случай, если произойдут какие-то ошибки. Итак, мы должны клонировать его.
А затем, давайте углубимся. Мы определяем цель и предиктор.
На этом этапе df_x представляет собой набор значений, а столбцы содержат символы работодателей, а df_y становится результатом работодателей, покинувших компанию. Теперь импортируйте библиотеку.
А затем напишите несколько заклинаний в своей волшебной книге:
Затем импортируйте некоторые библиотеки и напишите, какие столбцы вы хотите обработать.
Вот оно, Волшебство:
Ааааааа и БУМ!
Как видите, на каждом этапе есть своя причина, по которой машинное обучение решает, кто уходит, а кто остается. Синяя ячейка для работодателей, которые останутся, и оранжевая для работодателей останутся.
Есть четыре этапа, и чем глубже вы копаете, тем более конкретную информацию вы получаете в качестве причин, по которым решается это машинное обучение.
Это все люди. Я снова отправлюсь в приключение и вернусь за тобой, чтобы рассказать еще одну историю.
(Автор использует спелл-карту телепорта)
(Автор оставил костер авантюриста)
Чтобы получить больше информации :
https://github.com/gita87/machine-learning/blob/main/exe_Machine_Learning_Comparisons.ipynb