Использование Hypertools - набор инструментов Python

Визуализация данных помогает выявлять скрытые закономерности, ассоциации и тенденции между различными столбцами данных. Мы создаем различные типы диаграмм, графиков, графиков и т. Д., Чтобы понять, что такое данные и как разные столбцы связаны друг с другом.

Легко визуализировать данные с более низкими измерениями, но когда дело доходит до данных с более высокими измерениями, их очень сложно анализировать или визуализировать, поскольку невозможно показать большое количество измерений в визуализации.

Но что, если я скажу вам, что существует набор инструментов Python, который не только создает визуально привлекательные визуализации, но также способствует уменьшению размерности за один вызов функции.

Hypertools - это набор инструментов Python с открытым исходным кодом, который создает визуализации из высокомерных наборов данных, уменьшая размерность самостоятельно. Он построен на основе в основном matplotlib, sklearn и seaborn. В этой статье мы рассмотрим некоторые визуализации, которые мы можем создать с помощью гипоинструментов.

Давайте начнем…

Установка необходимых библиотек

Мы начнем с установки Hypertools с помощью pip. Команда, представленная ниже, сделает это.

pip install hypertools

Импорт необходимых библиотек

На этом этапе мы импортируем необходимую библиотеку, которая будет использоваться для создания визуализаций.

import hypertools as hyp

Создание визуализаций

Теперь приступим к созданию различных визуализаций и посмотрим, как работают гиперинструменты.

  1. Основной сюжет
# data loading
basic = hyp.load('weights_sample')
# Creating plot
basic.plot(fmt='.')

2. Кластерный график

clust = hyp.load('mushrooms')
# Creating plot
clust.plot(n_clusters=10)

3. Графики корпуса

Этот график используется для текстовых наборов данных.

text = ['i am from India', 'India is in asia', 'Asia is the largest continent',
        'There are 7 continents', 'Continents means earth surfaces ', 'Surfaces covers land area',
        'land area is largest in asia']
# creating plot
hyp.plot(text, '*', corpus=text)

4. UMAP

from sklearn import datasets

data = datasets.load_digits(n_class=6)
df = digits.data
hue = data.target.astype('str')
hyp.plot(df, '.', reduce='UMAP', hue=hue, ndims=2)

5. Анимированные сюжеты

ani = hyp.load('weights_avg')
# plot
ani.plot(animate=True, chemtrails=True)

Попробуйте это с разными наборами данных и создайте красивые визуализации для интерпретации данных. Если у вас возникнут какие-либо трудности, дайте мне знать в разделе ответов.

Эта статья написана в сотрудничестве с Пиюшем Ингале.

Ссылка: https://hypertools.readthedocs.io/en/latest/

Прежде чем ты уйдешь

Спасибо за чтение! Если вы хотите связаться со мной, свяжитесь со мной по адресу [email protected] или в моем профиле LinkedIn. Вы можете просмотреть мой профиль Github для различных проектов по науке о данных и руководств по пакетам. Кроме того, не стесняйтесь изучать мой профиль и читать разные мои статьи, связанные с наукой о данных.