Что такое «PivotTable.js»?

Вы слышали о PivotTable.js? Это очень крутая библиотека JavaScript, которая позволяет создавать потрясающие интерактивные сводные таблицы и диаграммы прямо в ваших веб-приложениях. С PivotTable.js вы можете копаться в своих массивных наборах данных и мгновенно (буквально) разбираться в них.

Представьте себе: у вас есть куча необработанных данных, и вам нужно извлечь из них осмысленную информацию. PivotTable.js спасет ваш день. Это дает вам удобный интерфейс, в котором вы можете перетаскивать поля, как профессионал, упорядочивая строки, столбцы и значения, как вам нравится, без необходимости конвертировать его в Excel/CSV для выполнения сводного анализа.

PivotTable.js может суммировать, считать, усреднять и выполнять всевозможные волшебные вычисления с вашими данными. А если вы хотите погрузиться глубже, вы можете сортировать, фильтровать и детализировать все, что душе угодно.

Использование PivotTable.js очень просто. Он может обрабатывать различные форматы данных, такие как JSON, CSV и Excel — все, что вы поместите в него в Python, что делает его очень универсальным. Кроме того, он настраиваемый, так что вы можете настроить его по своему вкусу.

Как это использовать?

Давайте проверим в каком-то наборе данных SuperStore, который я нашел в качестве образца для нашей опорной точки.

Во-первых, убедитесь, что у вас установлена ​​библиотека pandas. Вы можете установить его, запустив pip install pandas в своем терминале.

import pandas as pd
from pivottablejs import pivot_ui

# Let's load the Iris dataset first
df = pd.read_csv('https://raw.githubusercontent.com/leonism/sample-superstore/master/data/superstore.csv')
# Create a pivot table using pivottablejs
pivot_ui(df)

Потребовалось менее 1 секунды, чтобы проанализировать набор данных (10 800 строк x 21 столбец) и создать для него интерактивную сводку.

Теперь мы можем исследовать данные. Все просто, просто перетащите элементы строк и столбцов и выберите, что и как агрегировать.

Например, давайте подсчитаем уникальные идентификаторы строк по сегментам и странам.

Для этого мы можем с помощью оператора в верхней левой части таблицы «Подсчитать уникальные значения» и в раскрывающемся списке просто выбрать то, что вам нужно подсчитать. Затем мы перетаскиваем сегменты в строки и страны в столбцы. Назовем этот пример 1.

Итак, мы уже выяснили, что большинство строк относятся к потребительскому сегменту в США. Также мы видим, что есть пустые строки и нулевые значения.
Хотите увидеть разбивку сегментов на подкатегории? Просто перетащите категорию под сегменты. Назовем этот пример 2.

Пример 3. Давайте переключимся на суммы и рассчитаем общий доход по штатам, а затем перейдем к городам.

Пример 4. Теперь сосредоточимся только на Алабаме. Просто отфильтруйте его, используя раскрывающийся фильтр рядом с «Штат» («Выберите «Нет», а затем «Алабама»).

И вот! Это все фильтруется.

Пример 5. Столы скучны? Переключитесь на графики. Давайте возьмем сумму продаж и представим ее в виде гистограммы по режиму доставки и сегменту.

Пример 6. Теперь давайте углубимся в структуру прибыли по сегментам и режимам доставки с помощью древовидной карты.

Заворачивать

Видите, насколько быстр и полезен этот пакет? Вы просто перетаскиваете строки и столбцы и выбираете визуальные элементы и функции агрегирования. Ничего больше. Этот инструмент идеально подходит для быстрого анализа данных. Конечно, подготовка данных должна быть выполнена в Python заранее (например, добавление столбца «Год» на основе даты заказа или создание настраиваемых столбцов и т. д.), но многие основные элементы для исследования данных можно выполнить за считанные секунды. Дайте мне знать, если вы хотите узнать больше об инструменте и пакете.

Пожалуйста, похлопайте 👏 и подпишитесь, если хотите меня поддержать. Спасибо!❤️‍🔥