Что такое «PivotTable.js»?
Вы слышали о PivotTable.js? Это очень крутая библиотека JavaScript, которая позволяет создавать потрясающие интерактивные сводные таблицы и диаграммы прямо в ваших веб-приложениях. С PivotTable.js вы можете копаться в своих массивных наборах данных и мгновенно (буквально) разбираться в них.
Представьте себе: у вас есть куча необработанных данных, и вам нужно извлечь из них осмысленную информацию. PivotTable.js спасет ваш день. Это дает вам удобный интерфейс, в котором вы можете перетаскивать поля, как профессионал, упорядочивая строки, столбцы и значения, как вам нравится, без необходимости конвертировать его в Excel/CSV для выполнения сводного анализа.
PivotTable.js может суммировать, считать, усреднять и выполнять всевозможные волшебные вычисления с вашими данными. А если вы хотите погрузиться глубже, вы можете сортировать, фильтровать и детализировать все, что душе угодно.
Использование PivotTable.js очень просто. Он может обрабатывать различные форматы данных, такие как JSON, CSV и Excel — все, что вы поместите в него в Python, что делает его очень универсальным. Кроме того, он настраиваемый, так что вы можете настроить его по своему вкусу.
Как это использовать?
Давайте проверим в каком-то наборе данных SuperStore, который я нашел в качестве образца для нашей опорной точки.
Во-первых, убедитесь, что у вас установлена библиотека pandas. Вы можете установить его, запустив pip install pandas
в своем терминале.
import pandas as pd from pivottablejs import pivot_ui # Let's load the Iris dataset first df = pd.read_csv('https://raw.githubusercontent.com/leonism/sample-superstore/master/data/superstore.csv') # Create a pivot table using pivottablejs pivot_ui(df)
Потребовалось менее 1 секунды, чтобы проанализировать набор данных (10 800 строк x 21 столбец) и создать для него интерактивную сводку.
Теперь мы можем исследовать данные. Все просто, просто перетащите элементы строк и столбцов и выберите, что и как агрегировать.
Например, давайте подсчитаем уникальные идентификаторы строк по сегментам и странам.
Для этого мы можем с помощью оператора в верхней левой части таблицы «Подсчитать уникальные значения» и в раскрывающемся списке просто выбрать то, что вам нужно подсчитать. Затем мы перетаскиваем сегменты в строки и страны в столбцы. Назовем этот пример 1.
Итак, мы уже выяснили, что большинство строк относятся к потребительскому сегменту в США. Также мы видим, что есть пустые строки и нулевые значения.
Хотите увидеть разбивку сегментов на подкатегории? Просто перетащите категорию под сегменты. Назовем этот пример 2.
Пример 3. Давайте переключимся на суммы и рассчитаем общий доход по штатам, а затем перейдем к городам.
Пример 4. Теперь сосредоточимся только на Алабаме. Просто отфильтруйте его, используя раскрывающийся фильтр рядом с «Штат» («Выберите «Нет», а затем «Алабама»).
И вот! Это все фильтруется.
Пример 5. Столы скучны? Переключитесь на графики. Давайте возьмем сумму продаж и представим ее в виде гистограммы по режиму доставки и сегменту.
Пример 6. Теперь давайте углубимся в структуру прибыли по сегментам и режимам доставки с помощью древовидной карты.
Заворачивать
Видите, насколько быстр и полезен этот пакет? Вы просто перетаскиваете строки и столбцы и выбираете визуальные элементы и функции агрегирования. Ничего больше. Этот инструмент идеально подходит для быстрого анализа данных. Конечно, подготовка данных должна быть выполнена в Python заранее (например, добавление столбца «Год» на основе даты заказа или создание настраиваемых столбцов и т. д.), но многие основные элементы для исследования данных можно выполнить за считанные секунды. Дайте мне знать, если вы хотите узнать больше об инструменте и пакете.
Пожалуйста, похлопайте 👏 и подпишитесь, если хотите меня поддержать. Спасибо!❤️🔥