Полное руководство по созданию случайного классификатора лесов, выявлению основных особенностей и построению графика в Plotly.

Нет ничего более приятного после нескольких часов очистки и моделирования ваших данных, чем создание красивого графика, демонстрирующего ваш тяжелый труд. Я часто просматриваю веб-страницы в поисках #plotgoals изображений, поэтому я наткнулся на красивое изображение, которое вы видите выше.

Я создал это руководство, чтобы подробно рассказать вам, как создать собственный график, подобный этому, и улучшить визуальные эффекты игры.

Шаг 1:

Для начала вам нужно будет загрузить фрейм данных и решить, для какой функции вы создаете классификатор. После того, как вы определили этот столбец, установите вам переменные X (характеристики, которые вы будете использовать для прогнозирования) и y (то, что вы пытаетесь предсказать).

Шаг 2:

Затем вам нужно будет создать набор проверки для вашей модели, это можно легко сделать в sklearn - для воспроизводимости не забудьте установить параметр random_state! (42 - популярный вариант #dontpanic)

Шаг 3:

Теперь данные готовы для создания экземпляра и соответствия модели (в этом примере я использую случайный лес, но график будет работать с любой моделью, которую вы выберете, с небольшой корректировкой).

Шаг 4:

Теперь вы можете собрать свои самые важные функции. Для моделей случайного леса в sklearn есть алгоритм важности характеристик, который мы можем реализовать для нашего классификатора. Третья строка кода ниже создает список функций с их оценкой важности, обратите внимание, что «index = X.columns» означает, что в этом списке будет храниться имя столбца с оценкой - очень полезно для попытки выяснить, что все эти числа иметь в виду!

Это возвращает часть головоломки для нашего классификатора, теперь мы построили его, обучили и измерили, какие функции являются наиболее важными при прогнозировании нашей цели. Хотя технически нет необходимости идти дальше, вы здесь не для этого!

Шаг 5:

Здесь происходит волшебство! Импортируйте графически, а затем установите значение r на графике равным количеству, которое вы указали ранее, и значениям тета для соответствующих названий столбцов. Будь осторожен! Здесь важен порядок, поэтому не перепутайте свои ценности!

Plotly имеет так много параметров, что вы можете обновить их в словаре под исходным графиком - поиграйте с цветом, углом, направлением - без ограничений!

И готово - красивая графическая слайд-колода! Удачного построения графиков!