Учебники по ChartArt #1

Допустим, у нас есть простой фрейм данных, такой как этот:

Эти данные показывают определенную группу студентов, их соответствующие специальности, возраст и количество факультативов.

Теперь большая часть информации о данных поступает из их сводок, и именно здесь вступает в игру сводная таблица.

Например, предположим, что вы хотите узнать среднее количество факультативов для каждого пола по математике или литературе, тогда сделать это будет самым быстрым способом:

df.pivot_table('Количество факультативов', index='Пол', columns='Основные дисциплины')

Многоуровневые сводные таблицы:

Скажем, теперь вы хотите проверить в среднем, сколько факультативов выбирает студент определенного пола. Это дает больше размерности для вашего запроса.

age = pd.cut(df['Возраст'], [0, 40, 70])
df.pivot_table('Нет: факультативов', ['Пол', возраст], 'Основы' )

Вывод.
Итак, чтобы ответить на вопрос, сводная таблица — это функция, которая помогает группировать записи в данных по входным столбцам, чтобы дать многомерное обобщение данных.

Сводная таблица может показаться простой функцией, но она может слишком быстро производить очень мощный анализ.