Сделайте визуализацию данных интерактивной с помощью Plotly

Визуализация данных - важная часть деловой практики, потому что сегодня компании генерируют большие объемы данных. Датчики по всему миру собирают климатические данные, данные о пользователях, прогнозируемые данные о рулевом колесе и т. Д. Все эти собранные данные содержат ключевые идеи и визуализации для предприятий, которые упрощают понимание этих данных.

Большинству из нас нужно послушать музыку, чтобы понять, насколько она прекрасна. Но часто мы представляем статистику так: мы просто показываем ноты, мы не играем музыку. «« Ганс Рослин г

Анализ данных Python можно выполнить с помощью нескольких пакетов. Matplotlib и Seaborn - самые распространенные пакеты в Python. Поговорим о пакете Plotly. Его можно использовать в сценариях Python, записной книжке Jupyter и базах данных для веб-приложений.

Вступление

Matplotlib идеален, Seaborn великолепен, но Plotly? Это совершенно новый уровень. Plotly предлагает больше, чем ваш средний график, предоставляя возможности полной интерактивности и многочисленные инструменты редактирования. Отличается от других возможностью иметь графики в автономном или онлайн-режиме, он также оснащен надежным API, который будет работать без проблем, если он настроен для отображения графиков в веб-браузере, а также возможностью сохранять локальную копию. . Одна из единственных трудностей, с которыми вы столкнетесь, - это работа с множеством вариантов выбора ресурсов, которые вы хотите использовать для своих историй.

Настройка

Чтобы установить пакет Plotly, откройте Терминал и введите pip install plotly. Plotly - это платформа, работающая на JSON, формате, в котором параметры передаются в Plotly API в словарных форматах. Сюжет и информация сохраняются в вашей учетной записи Plotly при просмотре визуализаций. У вас будет в общей сложности 25 графиков, которые можно сохранить в Интернете без взимания платы за дополнительное хранилище в облаке, но эти изображения можно легко хранить локально и удалять, освобождая место для большего количества.

Есть два основных способа отображения графиков. Функция py.iplot() отображает графики в выходных данных под ячейкой, если вы используете Jupyter Notebook или другую интерактивную среду Python (файлы с расширением .ipynb ). С другой стороны, py.plot() возвращает URL-адрес, который можно сохранить, и использует веб-браузер по умолчанию для его открытия.

Начиная

import plotly.plotly as py
import plotly.graph_objs as go

import plotly.plotly as py: Он имеет функции для связи с серверами Plotly.

import plotly.graph_objs as go: Здесь есть функции для создания графических объектов. Это полезный модуль для вызова справки, чтобы увидеть все атрибуты, принятые в качестве параметров объекта.

Мы собираемся построить простую воронку конверсии для веб-сайта электронной коммерции. Цель состоит в том, чтобы построить простую воронку конверсии и получить полезную информацию.

Загрузить набор данных

Я воспользовался данными веб-сайтов электронной коммерции, доступными на Kaggle.

Перед загрузкой данных импортируйте необходимые зависимости.

Первым процессом в конвейере обработки данных является исследовательский анализ данных. Хорошая практика состоит в том, чтобы сначала понять данные и попытаться собрать из них как можно больше идей. EDA - это понимание имеющихся данных, прежде чем их испортить. Затем мы можем изучить данные, чтобы увидеть, сколько пропущенных значений присутствует в каждом наборе данных. В каждом наборе данных есть только один шаг воронки конверсии, и они связаны user_id

Теперь мы можем создать таблицу, в которой мы можем видеть значения для различных шагов воронки.

Базовая воронка конверсии

Воронка конверсии описывает различные этапы пути покупателя, ведущего к покупке, с разделением на верхнюю, среднюю и нижнюю воронки.

Эта воронка будет базовой. Давайте визуализируем воронку конверсии, показывающую количество конверсий для каждого события / фазы.

Подготовка и объединение данных для сегментированных воронок

Эта воронка представляет собой то же, что мы видим в table1.pyиз выше, но с большим визуальным эффектом. Кроме того, значительно сокращается количество пользователей на странице поиска по сравнению с количеством пользователей на странице оплаты. Это могло быть связано с очень многими факторами. Сайт электронной коммерции может предлагать различные стратегии, чтобы сдерживать клиентов и увеличивать их удержание.

Если мы углубимся в данные, мы сможем получить больше информации. На каждом этапе воронки мы можем найти взаимосвязь между полом и подтверждением оплаты. Для этого все фреймы данных необходимо объединить в один фрейм данных. Важно подсчитывать каждого пола на каждом этапе или процессе.

Представим приведенную выше таблицу в виде сегментированной воронкообразной диаграммы.

Судя по диаграмме сегментированной воронки, больше женщин сделали последний платеж за покупку продукта, чем мужчины. Хотя разница между полом небольшая.

Чтобы узнать, какой тип устройства каждый пол больше всего использует для доступа к сайту электронной коммерции, мы можем создать сегментированную воронку для каждого типа устройства и пола. Звучит хорошо, правда? Вернемся к данным снова

Это достигается с помощью функции groupby в Pandas. Мы объединяем данные о поле и типе устройства вместе.

Я построил воронкообразную диаграмму с накоплением для облегчения интерпретации и анализа.

Рекомендации

В зависимости от того, как долго ваш путь конверсии, вам может потребоваться ряд различных взаимодействий с вашими клиентами, чтобы заработать их лояльность и перевести их на следующий этап воронки.

Как мы видим по визуальному впечатлению, большинство пользователей заходят на сайт электронной коммерции со своего рабочего стола, и количество пользователей на домашней странице резко сокращается по сравнению с количеством пользователей на странице подтверждения. Сайт электронной коммерции может предлагать стратегии, чтобы удерживать клиентов от использования их настольных приложений. Есть много причин, по которым потенциальный покупатель отказывается от своей корзины. Они могли просто просматривать страницы, сравнивать цены или забыли совершить покупку. Брошенные тележки не означают пропущенные продажи, поэтому вы все равно можете общаться с ними, используя электронный маркетинг, ретаргетинговую рекламу или даже push-уведомления.

использованная литература

  1. Https://www.tutorialspoint.com/advanced_excel_charts/advanced_excel_funnel_chart.htm
  2. Https://www.kaggle.com/danielrozputnski/funnel-vizualitation-with-plotly
  3. Https://en.wikipedia.org/wiki/Conversion_funnel