Наука о данных, часть 7: что такое визуализация данных?

Как правильно сказано — «Картинка стоит тысячи слов». В науке о данных никто не может называть себя специалистом по данным, пока он не разбирается в визуализации. Визуализация данных и дизайн информационных панелей — это не только научные знания, для этого также необходимо, чтобы специалисты по данным использовали искусство для создания проектов, связанных с визуализацией данных. Несмотря на то, что мы знаем, какие методы создания дизайна панели инструментов и визуализации данных для нас важнее, какой из них использовать.



Это книга, которую я рекомендую вам, чтобы больше узнать о визуализации данных.

Всегда помните, графика обычно дает нам лучшее представление, потому что она четкая, привлекательная и убедительная. Разница между хорошей и плохой графикой может быть очень субъективной. Однако, как ни удивительно, существует очень мало ресурсов, которые могут научить вас делать убедительные визуализации данных.

Вы можете попробовать просмотреть эту книгу по своему желанию и выбрать конкретную интересующую вас часть постепенно, а не сразу. В течение более длительного периода времени вы можете попробовать применить эту концепцию к проекту, я уверен, что вы получите максимальную пользу от этой книги. Почти вся графика в этой книге сделана с помощью R и ggplot2, но концепция общего графического производства может быть применена и к остальным.





Выше 2 ссылки написаны на английском языке

https://dataviz.apachecn.org/#/

Вышеупомянутая ссылка написана на китайском языке.

Программное обеспечение для рисования/ Блок-схема построения графиков

  • Конвейер графического производства — графика должна генерироваться автоматически. Плохая идея, что многие студенты вручную редактируют график, изменяя шрифт меток осей, когда стороннее программное обеспечение не может генерировать ту же графику, которую они хотят. Обратите внимание, что Excel также является интерактивной программой для рисования, но не рекомендуется для построения графиков.
  1. Гнуплот
  2. Xfig
  3. Математика
  4. Матлаб
  5. matplotlib в Python
  6. Базовая библиотека R в R
  7. ggplot2 в R
  8. Сиборн
  9. сюжетно

Программа создания информационных панелей

  1. Power BI
  2. Таблица
  3. Excel
  4. Qlikview

Исследовательский анализ данных

  1. Определить вопросы: выявление взаимосвязей между переменными
  2. Обработка отсутствующих значений: проверьте собранные данные на наличие проблем, таких как отсутствующие данные или ошибка измерения, тип данных столбцов
  3. Выбросы: удалить выбросы
  4. Форматирование: стандартизируйте формат
  5. Фильтрация
  6. Одномерный и многомерный анализ






Как определить, какие показатели следует использовать

  1. Продукт. Сосредоточьтесь на ролях пользователей, информации и каналах, а также на связях между ними.
  2. Бизнес — укажите путь, который требуется роли пользователя для выполнения своих определенных задач, какие роли будут участвовать, какой модуль они задействуют, взаимосвязь между модулями, поток данных.
  3. Диаграмма бизнес-процессов — разложите функции, разделите конкретные подробные процессы, нештатные процессы или подсказки.

3 метода, которые мы можем использовать

  1. Метод поведения пользователя
  2. Метод разделения бизнеса
  3. Индексный метод


После того, как вы создадите лучшую графику визуализации данных, мы обычно проходим 4 этапа анализа данных.

1-й этап: описательная аналитика

  • Резюме исторических данных, описывающих то, что произошло в прошлом
  • ежедневные продажи, еженедельные отчеты, ежемесячные отчеты, годовые отчеты

2-й этап: диагностическая аналитика

  • Исследование и анализ исторических данных для диагностики причины
  • Обеспечьте быструю и интерактивную функцию детализации

3-й этап: прогнозная аналитика

  • Предсказание будущего на основе исторических данных
  • 1) визуализировать результаты предсказания
  • 2) Визуализируйте процесс прогнозирования, например модель прогнозирования.

4-й этап: предписывающая аналитика

  • Используется для анализа принятия решений
  • Используйте ИИ, чтобы дать оптимальное решение проблемы


Есть несколько хороших дизайнов и иллюстраций для визуализации данных

  1. https://pudding.cool/2017/01/making-it-big/
  2. https://vizknowledge.aalto.fi/archive/2018/showcase/on-their-way-the-journey-of-foreign-fighters/
  3. https://www.artsy.net/artwork/charles-joseph-minard-carte-figurative-et-approimative-des-quantites-de-coton-en-laine-importees-en-europe-en-1858-et -ан-1861
  4. https://truth-and-beauty.net/projects/muesli-ingredient-network
  5. https://www.visualcinnamon.com/portfolio/new-york-times-digital-trackers/

Ссылки







https://dataviz.apachecn.org/#/

Если вы нашли какие-либо из моих статей полезными или полезными, рассмотрите возможность бросить мне кофе, чтобы помочь поддержать мою работу или оказать мне покровительство😊, используя

Патреон

Ko-fi.com

купитькофе

И последнее, но не менее важное: если вы еще не являетесь участником Medium и планируете им стать, я прошу вас сделать это по следующей ссылке. Я получу часть вашего членского взноса без каких-либо дополнительных затрат для вас..





Больше контента на plainenglish.io. Подпишитесь на нашу бесплатную еженедельную рассылку здесь.