Практические руководства

На пути к лучшей визуализации данных и графике

Принципы дизайна для создания графики и визуальных элементов на основе данных

Это картографический образ. Он был создан Чарльзом Жозефом Минаром, чтобы показать русскую кампанию Наполеона 1812–1813 годов.

Современные информатики говорят, что это лучший статистический график, когда-либо созданный в истории человечества. График Минарда представляет собой богатую, последовательную историю на основе многомерных данных и отображает размер армии, ее расположение в двухмерной плоскости, направление движения, температуру в разные дни во время отступления. Это одно из самых сжатых представлений данных с помощью наглядного пособия.

Можем ли мы создать свой собственный образный карт?

Возможно!

Современные технические и научные публикации содержат 25% визуальной информации, колоды, которые мы создаем для повседневной деловой активности, содержат около 60% визуального контента (графики, диаграммы и т. Д.); Это веский аргумент в пользу движения к совершенству графики.

Зачем сосредотачиваться на визуализации?

Визуализация данных является важной частью науки о данных и машинного обучения, поскольку необходимо изучить данные, прежде чем помещать их в модели, а затем сообщить результаты соответствующим заинтересованным сторонам.

Визуальное отображение количественной информации - это вневременная классика Эдварда Тафти (произносится как Тафти) и одна из лучших научно-популярных книг 20-го века. В нем рассказывается об истории визуальной графики, принципах графического совершенства и фундаментальных правилах, которым необходимо следовать при разработке графики на основе данных.

Как специалист по данным, я извлек огромную пользу из знаний, содержащихся на 200 с лишним страницах.

Ключевые выводы и лучшие графики

  1. Уберите беспорядок - удалите все, что вам не нужно. Меньше - больше.
  2. Никаких круговых диаграмм - они не делают так много, как человеческий глаз не может расшифровать размер кусочков круга, особенно. когда они в чем-то равны.
  3. Не нужно визуализировать каждый раз - если у вас недостаточно данных, используйте только большое число или таблицу для отображения информации.
  4. Помните об аудитории - аудитория не должна тратить много времени на анализ изображения. Данные должны выделяться на фоне самого изображения. Используйте основные и примитивные визуальные подсказки, такие как цвет, форма, размер, чтобы привлечь внимание.
  5. Не искажайте данные. Идея, согласно которой данные искажаются настолько, чтобы рассказать свою историю, не является хорошим принципом для следования. Пусть данные говорят сами за себя.

Как лучше разрабатывать диаграммы?

Вот здесь-то и проявляется превосходство графики.

Великолепная графика дает зрителю наибольшее количество идей в кратчайшие сроки на минимальном пространстве.

Вы можете добиться этого на своих графиках с помощью трех простых механизмов:

  1. Никакого мусора с диаграмм - Удалите странные шрифты, текстуры, затенения и все, что может отвлечь аудиторию от основной идеи изображения и данных.
  2. Никакой бесполезной информации - для отображения данных следует использовать большую часть вашего графика.

Проще говоря, показывайте только то, что необходимо.

3. Сущность важнее дизайна. Ваша диаграмма должна побуждать пользователя задуматься о данных и содержании, которое она предлагает, а не теряться в методологии создания графики / визуализации. Итак, обращайтесь к естественному способу того, как люди понимают и направляют свое внимание - от большого к малому, от темного к светлому, слева направо, сверху вниз.

Другой важный момент для создания визуала - это намерение - зачем вообще визуал был создан? Содержание диаграммы должно быть составлено таким образом, чтобы способствовать принятию решений путем сообщения выводов.

Движущей силой вашей диаграммы должно быть не использование определенных инструментов, пакетов программного обеспечения или библиотек, а сообщение выводов, которые вы сделали на основе данных.

Графики в действии

Давайте посмотрим, как эти принципы можно применить в нашей работе.

Я создал фиктивные данные для фильмов, которые смотрел и любил в период с 2011 по 2016 год. Давайте создадим сравнительную таблицу по годам.

Я придумал это в первой итерации.

Посмотрим, сможем ли мы это исправить.

Кажется, там много мусора. Первая - это таблица под диаграммой, метки осей. Имеется плотная фоновая сетка, которая не служит ни для каких целей и поэтому является одноразовой.

Небольшие изменения здесь и там, и мы пришли к гораздо лучшему визуальному оформлению, чем раньше.

Он намного чище, четче и может отображать то, что хочет, без предоставления ненужной информации.

Еще один пример

Вымышленный владелец магазина хочет сравнить продажи различных товаров в первом полугодии и создал следующую таблицу:

В этом визуальном оформлении нет ничего принципиально неправильного, но и нет никаких выводов, которые выделялись бы. Что здесь за закономерность? К чему должен прийти владелец магазина?

Может ли это быть лучший способ визуализации?

Если разбить график четырьмя способами, можно увидеть закономерность, и это будет ключевым выводом.

Хорошо, еще один!

Новый продукт был выпущен вымышленной компанией, и маркетинговая группа провела опрос существующих клиентов.

Это говорит нам о том, что большинство пользователей не заинтересованы, но это все, а остальная половина не слишком информативна.

Это можно и нужно исправить путем сортировки данных.

Это выглядит намного лучше и информативнее, поскольку читатель может очень быстро понять, кто меньше всего заинтересован, а кто больше всего заинтересован в продукте.

Сделайте информацию красивой

Цель графиков на основе данных - не создавать визуальные эффекты для творчества, а сообщать о выводах, чтобы принимать решения.

Визуализация может вам очень помочь, если вы сделаете шаг назад, задумаетесь, в чем цель графики, сохраните простоту при проектировании и у вас есть что рассказать.