Использование Datapane для анализа и визуализации данных

Создание визуализации данных для анализа данных может выполняться с использованием различных библиотек Python. Нам просто нужно создать различные визуализации, такие как гистограммы, гистограммы и т. Д. Существует большое количество библиотек Python для визуализаций данных, которые могут создавать N визуализаций, но проблема с этими визуализациями заключается в том, что вы не можете поделиться ими в формате отчета или вставлять их в отчеты.

Создание отчетов о визуализации данных помогает провести презентацию, поделиться ею с клиентами или поделиться ею с вашим начальником. Он оказывает хорошее влияние, когда вы создаете отчет, содержащий визуализацию, а также уценки. Также вы можете поделиться этими отчетами.

Datapane - это библиотека Python с открытым исходным кодом, которая используется для создания визуализации данных, аналитических отчетов, в которых мы можем объединить все наши визуализации и анализ в один отчет, который может быть опубликован на сервере Datapane и может быть легко опубликован.

Давайте начнем…

Создание учетной записи Datapane

Перед созданием отчетов вам сначала необходимо создать учетную запись на Datapane, чтобы мы могли публиковать наши отчеты в этой учетной записи и делиться ссылкой с кем угодно. Для создания учетной записи вы можете перейти по ссылке ниже. Как только вы создадите учетную запись, вы увидите ключ доступа к Datapane, который мы будем использовать для публикации наших отчетов из нашей записной книжки Jupyter.



Установка необходимых библиотек

Начнем с установки Datapane с помощью pip. Команда, приведенная ниже, сделает это.

pip install datapane

После установки мы также загрузим наш токен входа (ключ доступа), используемый для публикации отчетов в нашей учетной записи.

!datapane login --token=<YOUR TOKEN>

Импорт необходимых библиотек

На этом этапе мы импортируем необходимые библиотеки для создания визуализаций.

import datapane as dp
import pandas as pd
import seaborn as sns

Импорт набора данных

Мы начнем с импорта необходимого набора данных. В этой статье мы используем набор данных, уже определенный в библиотеке seaborn под названием Tips.

df = sns.load_dataset('tips')
df.head()

Создание визуализаций

Теперь мы создадим несколько визуализаций, которые добавим в наши отчеты.

plot1 = sns.regplot(x="total_bill", y="tip", data=df)
plot2 = df.hist()
plot 3 = df.boxplot(column=['total_bill'])

Создать и опубликовать отчет

Это последний шаг, на котором мы создадим отчет и опубликуем его.

report = dp.Report(
    dp.Text("Visualization Report"),
    dp.Plot(plot1),
    dp.Plot(plo2),
    dp.Plot(plot3)
)
report.publish(name='My First Report', open=True)

После публикации отчета вы можете визуализировать это по предоставленной вам ссылке, и вы можете поделиться ею с кем угодно по их почтовым идентификаторам.

Попробуйте это с разными наборами данных и создайте красивые отчеты визуализации для анализа данных. Если у вас возникнут трудности, дайте мне знать в разделе ответов.

Эта статья написана в сотрудничестве с Пиюшем Ингале.

Прежде чем ты уйдешь

Спасибо за чтение! Если вы хотите связаться со мной, свяжитесь со мной по адресу [email protected] или в моем профиле LinkedIn. Вы можете просмотреть мой профиль Github для различных проектов по науке о данных и руководств по пакетам. Кроме того, не стесняйтесь изучать мой профиль и читать разные мои статьи, связанные с наукой о данных.