Узнайте, как данные визуализируются по-разному

Это продолжение статистики, первую статью вы можете посмотреть здесь



Тип данных:

Визуализация данных:

визуализация категориальных данных:

Категориальные данные могут отображаться в виде таблиц распределения частот, гистограмм, круговых диаграмм и диаграмм Парето.

Таблица распределения частот: c

Круговая диаграмма:

Этот график широко используется в рыночном секторе.

Диаграмма Парето:

Диаграмма Парето использует правило 80–20. 80% эффекта происходит от 20% причин. На диаграмме Парето используется кумулятивная частота.

Визуализация числовых данных:

мы можем использовать таблицу распределения частот и гистограмму.

мы можем выбрать интервал классов от 5 до 20. Я возьму желаемый интервал как 5, а ширину интервала можно рассчитать путем вычитания большого числа и малого числа из набора данных, за которым следует несколько желаемых интервалов.

В моем случае наибольшее число из набора данных - 38, а наименьшее число из моего набора данных - 1.

Вычитая наибольшее число и наименьшее число, я получил 37 и разделив на количество желаемых интервалов, я получил 7,4, которые будут приняты за 8.

  • Относительную частоту можно рассчитать по формуле

Визуализация категориальных переменных:

Визуализация категориальных переменных следует

  1. Кросс-таблицы
  2. Диаграммы разброса

Кросс-таблицы:

В этой таблице используется горизонтальная линейчатая диаграмма.

Диаграммы разброса:

в основном визуализация диаграмм рассеяния широко используется для представления двух числовых переменных.

Меры центральной тенденции:

  1. Иметь в виду
  2. Медиана
  3. Режим

Среднее: - используется для вычисления среднего значения, которое обозначается μ для среднего генерального значения и x̄ (x bar) для выборки. иметь в виду.

  • Складываем все компоненты и делим на количество компонентов.

Набор данных: 1, 1, 1, 3, 3, 3, 5, 5

Медиана: - Чтобы найти среднее, расположите все значения по порядку и найдите среднее значение.

Когда у медианы два значения?

Чтобы найти медиану для двух значений

Режим: - режим определяется как «наиболее часто встречающееся значение» или подсчет наиболее повторяющегося значения. Другими словами, мы можем легко определить значение режима по значению, которое встречается несколько раз.

  • Пример: - Набор данных: 4, 1, 5, 2, 1, 2, 4, 4, 5, 5, 4.
  • Из вышеприведенного набора данных 4 - это режим, потому что он часто встречается.

Бимодальный: если режим имеет два значения режима.

Мультимодальный. Мультимодальный режим, когда набор данных содержит более одного режима, называется мультимодальным. Это то же самое, что и бимодальный.

  • Набор данных: 4, 4, 4, 4, 3, 2, 6, 5, 5, 8, 5, 7, 4, 5, 5
  • Из приведенного выше у нас есть два повторяющихся значения, поэтому это относится к мультимодальным перевозкам.
Thank you

Читать другие статьи: