Используя визуализацию данных, мы можем отображать наши данные во многих графических форматах. Визуализация данных упрощает нам анализ и получение важной информации из данных. Кроме того, табличные данные сложно интерпретировать; но благодаря визуализации наша интерпретация данных значительно упрощается.
Для визуализации доступно множество различных графических представлений.
Наиболее распространенными библиотеками Python, используемыми для визуализации, являются Matplotlib и Seaborn.

У нас есть множество графиков на выбор при выполнении визуализации данных. Тем не менее, необходимо знать характер особенностей данных, чтобы принять наилучшее решение.

Функции делятся на две категории:
Функции, имеющие числовые значения, называются числовыми функциями. Примеры включают возраст, рост, расстояние и т. д.
Функции, содержащие категории, называются категориальными функциями. Примеры Город, пол, цвет и т. д.

Различные типы графиков.

  1. Точечная диаграмма

Чтобы увидеть связь между двумя числовыми характеристиками, используйте диаграмму рассеяния. Если один признак зависит от другого, то независимый признак откладывается по оси X, а зависимый признак — по оси Y.

Разные параметры точечной диаграммы
Цвет: используется для присвоения категорий точкам данных.
Размер: выбирая любой дифференцирующий фактор, мы можем различать разные размеры точек данных в точечная диаграмма.
Прозрачность: изменяется путем изменения значения альфа-параметра, где 0 — прозрачный, а 1 — непрозрачный.
Стиль: выбирая различные стили точек, можно различать данные точки.

Дополнительные параметры можно изучить на сайте Seaborn.

2. Участки распределения

Графики распределения помогают проиллюстрировать такие атрибуты, как отклонение, средние значения и другие статистические сводки, отображая одну числовую характеристику.

Три основных графика распределения:
График ковра
Гистограмма
График KDE

а) Ковровый участок

Значение данных отмечено на оси X на ковровом графике, который используется для иллюстрации распределения данных. Подобно гистограмме без бинов,
Rug Plot позволяет быстро идентифицировать выбросы.

б) Гистограмма

Чтобы построить гистограмму, данные сначала должны быть разделены на группы, т. е. разделены на группы с предпочтительно равными интервалами, хотя также можно использовать группы с неравными интервалами для отображения распределения данных.

в) КДЕ

Распределение вероятностей данных показано в области под кривой на графике, называемом оценкой плотности ядра. KDE можно визуализировать для одной переменной или группы переменных.

3. Категориальные графики

Категориальные графики, описанные в этой статье, будут отображать статистические параметры для каждой категории, такие как среднее значение по категории.
Упомянуты два графика категорий.
1. Первый график — это график подсчета, который показывает, сколько строки есть в каждой категории.

2. Гистограмма: метод отображения любой статистической метрики по категориям, таким как среднее значение, стандартное отклонение и т. д. По оси X требуется категориальная переменная, а по оси Y — числовая переменная.

4. Сравнительные графики

Сравнительные графики — это, по сути, двумерные версии графиков, которые мы изучали до сих пор.

Два основных графика сравнения

1. Присоединяйтесь к сюжету

График соединения состоит из трех графиков, один график отображает двумерный график, который показывает, как зависимая переменная (Y) зависит от независимой переменной (X), которая показана с помощью диаграммы рассеяния. Другой график расположен горизонтально в верхней части двумерного графика и показывает распределение независимой переменной (X). Третий график расположен на правом краю двумерного графика с вертикальной ориентацией и показывает распределение зависимой переменной (Y).

2. Парный сюжет

Парный график — это быстрый способ сравнить все числовые столбцы во фрейме данных. Он создает гистограмму для каждого столбца и сравнение диаграммы рассеяния между всеми возможными комбинациями столбцов.

Он очень требователен к ОЗУ, поэтому нужно быть осторожным при выборе парного графика с избыточными данными.

Дальнейшие сюжеты можно изучить на сайте Seaborn.

Спасибо!