4 хитрости для улучшения визуализации с Seaborn

Я не знал, что создание визуализаций может быть чем-то забавным и стимулирующим; Сначала, когда я начал изучать машинное обучение, я использовал стандартную графику, которая входит в стандартную комплектацию Seaborn или Matplotlib, но постепенно я обнаружил, насколько хороши они могут быть.

Я собираюсь использовать вымышленный набор данных, созданный учеными IBM о факторах, ведущих к увольнению сотрудников, который вы можете найти в Kaggle.

Сначала я импортирую основные библиотеки, а затем мы можем быстро просмотреть данные.

Этот набор данных раскрывает факторы, которые приводят к увольнению сотрудников, и исследует важные вопросы, такие как покажите мне разбивку расстояния от дома по должностным обязанностям и увольнению или сравните среднемесячный доход по образованию и увольнению («Kaggle).

Давайте построим простой график количества сотрудников и коэффициента убыли.

Мы используем гистограмму с обычной конфигурацией Seaborn, и результат выглядит следующим образом:

Итак, у нас есть наш первый график, но давайте посмотрим, как мы можем его улучшить!

Изменить начальные настройки

С помощью нескольких строк кода в начале нашей записной книжки (InlineBackend,sns.set_style…) мы можем изменить способ отображения графики; например, использование режима «ретина» сделает их более четкими.

Мы также можем использовать sns.despine(), чтобы указать, какие оси использовать (не беспокойтесь о тикере matplotlib, я расскажу вам позже, для чего он используется). Посмотрим, как это выглядит!

Цвета

Когда дело доходит до одежды, важно знать, как правильно сочетать цвета; когда мы правильно ими пользуемся, то нам говорят, что у нас хороший вкус. То же самое касается графики.

Цветов бесчисленное множество, и иногда бывает трудно правильно подобрать, но есть веб-сайты, которые могут помочь нам в выборе хорошей цветовой палитры.

Мне нравится использовать светлые тона для большей части данных и насыщенные цвета для бликов; например, здесь я использую светлые оттенки синего и красного в качестве контраста.

Заголовки и названия

Обычно мы можем использовать plt.title() , plt.xlabel и plt.ylabel для определения заголовков и названий осей. Но мы можем, в случае заголовков, придать другой, более персонализированный вид, используя текст. Давай увидим это!

Используя текст, я могу сказать, где я хочу разместить заголовок, а также шрифт и размер. Это результат.

Мелкие детали

Наконец, давайте посмотрим, что с некоторыми небольшими дополнительными изменениями мы можем сделать более красивую графику без особых усилий (это будет, например, использование аксессуаров, когда мы одеваемся).

На этом графике показан средний ежемесячный доход на одну должность. Что ж, давайте поставим хороший заголовок и добавим формат валюты по оси x, чтобы он выглядел лучше (помните matplotlib tinker?).

Мы почти у цели, у нас есть все: хороший костюм, хорошие аксессуары и последний штрих, хорошие духи.
Для этого мы добавим данные на график, используя текст и вертикальную линию, которая сообщает нам средний доход компании в целом.

и это окончательный результат ¡¡¡¡

Это была моя первая статья на Medium, я думаю, что мог бы яснее объяснить свои методы, но я хотел быть кратким, думаю, в следующей статье я сделаю лучше.
Надеюсь, вам понравилось, как и мне. обычно читаю ваши статьи!
хорошего дня !

pd: все работы можно посмотреть в kaggle: https://www.kaggle.com/gonzalogarciafuste