Визуализация данных, или DataViz, является одним из наиболее важных аспектов машинного обучения, науки о данных и анализа данных. Это помогает специалисту по данным или инженеру по машинному обучению, раскрывая скрытые аспекты данных, которые в противном случае было бы невозможно определить или потребовало бы значительных усилий для изучения. Вот 3 лучшие библиотеки DataViz на Python, которые можно использовать в своих проектах.
1. Matplotlib
Основанная на механизмах Cairo и Anti-Grain Geometry, Matplotlib позволяет пользователю создавать статические, анимированные и интерактивные визуализации в Python. Его можно использовать с Python и Numpy. У него есть API для включения этих визуализаций в приложения с использованием наборов инструментов общего назначения с графическим интерфейсом, таких как Tkinter, wxPython, Qt или GTK.
Вы можете найти больше о них в их репозитории GitHub: https://github.com/matplotlib/matplotlib
Кроме того, установить его на Python довольно просто. Все, что вам нужно сделать, это использовать следующую строку кода:
pip install matplotlib
Чтобы использовать его, вы можете использовать приведенный ниже код, который не только импортирует библиотеку, но и показывает установленную версию:
import matplotlib
matplotlib.__version__
2. сюжет
Это интерактивная графическая библиотека для Python с открытым исходным кодом и браузером. Он построен на основе библиотеки JavaScript plotly.js и содержит более 30 типов диаграмм. К ним относятся научные диаграммы, трехмерные графики, статистические диаграммы, карты SVG, финансовые диаграммы и многое другое.
Вы можете узнать о них больше в их репозитории GitHub:
https://github.com/plotly/plotly.py
Кроме того, установить его на Python довольно просто. Все, что вам нужно сделать, это использовать следующую строку кода:
pip install plotly
Чтобы использовать его, вы можете использовать следующий код:
import plotly.graph_objects as go
3. Сиборн
Seaborn — это библиотека DataViz на Python, основанная на Matplotlib. Он служит высокоуровневым интерфейсом для построения инновационных статистических графиков. Для установки Seaborn вам потребуются Numpy, Pandas и Matplotlib, которые должны присутствовать в вашей системе. Некоторые функции в Seaborn могут дополнительно использовать Scipy и/или Statsmodels, если они доступны.
Вы можете узнать о них больше в их репозитории GitHub:
https://github.com/plotly/plotly.py
Кроме того, установить его на Python довольно просто. Все, что вам нужно сделать, это использовать следующую строку кода:
pip install seaborn
Чтобы использовать его, вы можете использовать следующий код:
импортировать Seaborn как sns
Надеюсь, вы сможете использовать эти библиотеки DataViz с пользой. Однако какую бы библиотеку вы ни использовали, вам необходимо иметь общее представление о том, что представляет собой каждый тип диаграммы, и какой тип данных вы должны отображать с их помощью. С этими базовыми знаниями ни одна из библиотек DataViz не сможет помочь вам лучше узнать набор данных, с которым вы работаете.