Масштабируемая функция Python для создания высококачественных интерактивных визуальных элементов для функций в наборе данных.

Возможно, наиболее привлекательным способом понимания ваших данных является визуализация.

Altair — это пакет, который я использовал в течение последнего года и который постоянно обеспечивает высококачественные интерактивные визуальные эффекты. Ниже приведена функция, которую я написал для создания интерактивных диаграмм для всех функций в наборе данных. Он возвращает гистограмму + диаграмму рассеяния для числовых функций и гистограмму + диаграмму для категориальных функций.

Хотя он ни в коем случае не является исчерпывающим, этот код служит отправной точкой для дальнейшей настройки. Выводимые визуальные эффекты интерактивны при сохранении в виде HTML-документа.

После создания функции следующий код компилирует все визуальные элементы в один HTML-документ:

Заключение

Аналитика данных достаточно сложна. Нет необходимости создавать визуальные эффекты на этапе исследовательского анализа. Я надеюсь, что вы используете эту функцию и адаптируете ее к своим потребностям!

Следующий

В прошлый раз, когда я писал up next, я сказал, что напишу пост о своем первом опыте использования kaggle. Хотя я в конце концов закончу эту статью, я собираюсь публиковать короткие статьи, подобные этой, документируя некоторые из более сложных кодов, чтобы окончательная основная статья была короче и легче усваивалась.