Использование Datapane для анализа и визуализации данных
Создание визуализации данных для анализа данных может выполняться с использованием различных библиотек Python. Нам просто нужно создать различные визуализации, такие как гистограммы, гистограммы и т. Д. Существует большое количество библиотек Python для визуализаций данных, которые могут создавать N визуализаций, но проблема с этими визуализациями заключается в том, что вы не можете поделиться ими в формате отчета или вставлять их в отчеты.
Создание отчетов о визуализации данных помогает провести презентацию, поделиться ею с клиентами или поделиться ею с вашим начальником. Он оказывает хорошее влияние, когда вы создаете отчет, содержащий визуализацию, а также уценки. Также вы можете поделиться этими отчетами.
Datapane - это библиотека Python с открытым исходным кодом, которая используется для создания визуализации данных, аналитических отчетов, в которых мы можем объединить все наши визуализации и анализ в один отчет, который может быть опубликован на сервере Datapane и может быть легко опубликован.
Давайте начнем…
Создание учетной записи Datapane
Перед созданием отчетов вам сначала необходимо создать учетную запись на Datapane, чтобы мы могли публиковать наши отчеты в этой учетной записи и делиться ссылкой с кем угодно. Для создания учетной записи вы можете перейти по ссылке ниже. Как только вы создадите учетную запись, вы увидите ключ доступа к Datapane, который мы будем использовать для публикации наших отчетов из нашей записной книжки Jupyter.
Установка необходимых библиотек
Начнем с установки Datapane с помощью pip. Команда, приведенная ниже, сделает это.
pip install datapane
После установки мы также загрузим наш токен входа (ключ доступа), используемый для публикации отчетов в нашей учетной записи.
!datapane login --token=<YOUR TOKEN>
Импорт необходимых библиотек
На этом этапе мы импортируем необходимые библиотеки для создания визуализаций.
import datapane as dp import pandas as pd import seaborn as sns
Импорт набора данных
Мы начнем с импорта необходимого набора данных. В этой статье мы используем набор данных, уже определенный в библиотеке seaborn под названием Tips.
df = sns.load_dataset('tips') df.head()
Создание визуализаций
Теперь мы создадим несколько визуализаций, которые добавим в наши отчеты.
plot1 = sns.regplot(x="total_bill", y="tip", data=df) plot2 = df.hist() plot 3 = df.boxplot(column=['total_bill'])
Создать и опубликовать отчет
Это последний шаг, на котором мы создадим отчет и опубликуем его.
report = dp.Report( dp.Text("Visualization Report"), dp.Plot(plot1), dp.Plot(plo2), dp.Plot(plot3) ) report.publish(name='My First Report', open=True)
После публикации отчета вы можете визуализировать это по предоставленной вам ссылке, и вы можете поделиться ею с кем угодно по их почтовым идентификаторам.
Попробуйте это с разными наборами данных и создайте красивые отчеты визуализации для анализа данных. Если у вас возникнут трудности, дайте мне знать в разделе ответов.
Эта статья написана в сотрудничестве с Пиюшем Ингале.
Прежде чем ты уйдешь
Спасибо за чтение! Если вы хотите связаться со мной, свяжитесь со мной по адресу [email protected] или в моем профиле LinkedIn. Вы можете просмотреть мой профиль Github для различных проектов по науке о данных и руководств по пакетам. Кроме того, не стесняйтесь изучать мой профиль и читать разные мои статьи, связанные с наукой о данных.