Узнайте, как данные визуализируются по-разному
Это продолжение статистики, первую статью вы можете посмотреть здесь
Тип данных:
Визуализация данных:
визуализация категориальных данных:
Категориальные данные могут отображаться в виде таблиц распределения частот, гистограмм, круговых диаграмм и диаграмм Парето.
Таблица распределения частот: c
Круговая диаграмма:
Этот график широко используется в рыночном секторе.
Диаграмма Парето:
Диаграмма Парето использует правило 80–20. 80% эффекта происходит от 20% причин. На диаграмме Парето используется кумулятивная частота.
Визуализация числовых данных:
мы можем использовать таблицу распределения частот и гистограмму.
мы можем выбрать интервал классов от 5 до 20. Я возьму желаемый интервал как 5, а ширину интервала можно рассчитать путем вычитания большого числа и малого числа из набора данных, за которым следует несколько желаемых интервалов.
В моем случае наибольшее число из набора данных - 38, а наименьшее число из моего набора данных - 1.
Вычитая наибольшее число и наименьшее число, я получил 37 и разделив на количество желаемых интервалов, я получил 7,4, которые будут приняты за 8.
- Относительную частоту можно рассчитать по формуле
Визуализация категориальных переменных:
Визуализация категориальных переменных следует
- Кросс-таблицы
- Диаграммы разброса
Кросс-таблицы:
В этой таблице используется горизонтальная линейчатая диаграмма.
Диаграммы разброса:
в основном визуализация диаграмм рассеяния широко используется для представления двух числовых переменных.
Меры центральной тенденции:
- Иметь в виду
- Медиана
- Режим
Среднее: - используется для вычисления среднего значения, которое обозначается μ для среднего генерального значения и x̄ (x bar) для выборки. иметь в виду.
- Складываем все компоненты и делим на количество компонентов.
Набор данных: 1, 1, 1, 3, 3, 3, 5, 5
Медиана: - Чтобы найти среднее, расположите все значения по порядку и найдите среднее значение.
Когда у медианы два значения?
Чтобы найти медиану для двух значений
Режим: - режим определяется как «наиболее часто встречающееся значение» или подсчет наиболее повторяющегося значения. Другими словами, мы можем легко определить значение режима по значению, которое встречается несколько раз.
- Пример: - Набор данных: 4, 1, 5, 2, 1, 2, 4, 4, 5, 5, 4.
- Из вышеприведенного набора данных 4 - это режим, потому что он часто встречается.
Бимодальный: если режим имеет два значения режима.
Мультимодальный. Мультимодальный режим, когда набор данных содержит более одного режима, называется мультимодальным. Это то же самое, что и бимодальный.
- Набор данных: 4, 4, 4, 4, 3, 2, 6, 5, 5, 8, 5, 7, 4, 5, 5
- Из приведенного выше у нас есть два повторяющихся значения, поэтому это относится к мультимодальным перевозкам.
Thank you