Для проверки статистической значимости доступно множество материалов. Этот блог дает вам краткое представление о том, почему, что, когда и как использовать статистический тест ?. Кроме того, это сообщение в блоге представляет собой попытку быстрого пересмотра использования этих статистических тестов. p-значение и гипотеза не обсуждались в этом блоге, и вы можете проверить его здесь.

Зачем нам нужно много статистических тестов?

Например, мы хотим измерить вес мяча. У нас есть четыре устройства для измерения, такие как физические весы, термометр, линейка и мерная колба. Какой из них выбрать? Очевидно, мы выбираем физический баланс. Не правда ли? Предположим, мы хотим измерить температуру мяча? Затем выбираем градусник. По объему выбираем мерную колбу.

Теперь вы можете видеть, что, поскольку переменная, которую мы хотим измерить, изменяется, изменяется и устройство. Точно так же, почему у нас так много статистических тестов? У нас есть разные типы переменных и анализа. По мере изменения типа анализа меняются и статистические тесты.

Возьмем другой пример. Предположим, Учитель хочет сравнить рост мальчиков и девочек в классе.

Итак, Учитель выдвигает нулевую и альтернативную гипотезу. Здесь,

Нулевая гипотеза (H0) → Рост мальчиков и девочек одинаков, и любая наблюдаемая разница в росте случайна.

Альтернативная гипотеза (H1) → Рост мальчиков выше, чем рост девочек, поэтому наблюдаемая разница в росте реальна.

Как проверить эту гипотезу? Для этого важен тест на статистическую значимость.

Что такое тест статистической значимости?

Это тест, который помогает исследователям или аналитикам подтвердить гипотезу. Другими словами, эти тесты помогают определить, верна ли гипотеза?

Есть много статистических тестов. Но в этом блоге мы увидим два типа.

Тест на статистическую значимость делится на два типа.

Следующий вопрос, когда использовать?

Выбор статистического теста

И в параметрических, и в непараметрических тестах используются разные типы тестов (различные типы параметрических тестов описаны ниже), но как аналитик или исследователь выбирает правильный тест на основе дизайна исследования, типа переменной и распределения?

В приведенной ниже таблице приводится сводка вопросов, на которые необходимо ответить, прежде чем можно будет выбрать правильный тест. Ссылка: Университет Миннесоты. Вы можете проверить здесь.

Что такое параметрический тест?

Используется, если информация о популяции полностью известна посредством ее параметров, тогда статистический тест называется параметрическим тестом.

Типы параметрических тестов

1) t-тест

t-тест для одного образца

T-тест сравнивает разницу между двумя средними значениями в разных группах, чтобы определить, является ли разница статистически значимой

Возьмем пример набора данных hbs2. Набор данных содержит 200 наблюдений от выборки старшеклассников. У него есть пол, социально-экономический статус, этническое происхождение, баллы по таким предметам, как чтение, письмо, математика, общественные науки.

Здесь я хотел бы проверить, значительно ли отличается средний балл по письму от 50.

Здесь значение p меньше 0,05. Следовательно, среднее значение переменной write для этой выборки студентов составляет 52,77, что статистически значимо отличается от тестового значения 50. Мы можем сделать вывод, что эта группа студентов имеет значительно более высокое среднее значение по письменному тесту, чем 50.

t-тест для двух образцов

Он используется, когда две независимые случайные выборки происходят из нормальных популяций, имеющих неизвестную или одинаковую дисперсию. Он разделен на два типа

  1. Независимый двухвыборочный T-тест:

T-тест независимых выборок используется, когда вы хотите сравнить средние значения нормально распределенной интервальной зависимой переменной для двух независимых групп. Другими словами, этот t-тест предназначен для сравнения средних значений одной и той же переменной между двумя группами.

Здесь мы хотели бы проверить, одинаковы ли средние значения для письма для мужчин и женщин. (female - это переменная, которая состоит из 0 и 1 (0 - ›Male и 1 -› Female). Эта переменная необходима для проведения независимого группового t-теста и определяется оператором class.

В нашем наборе данных мы сравниваем средний балл по письму между группой студенток и группой студентов мужского пола (в приведенном выше коде упоминается как класс, а женщина является переменной (0 - ›Мужской и 1 -› Женский). Это дает две возможные разные t-статистики и два разных значения p. Интерпретация p-значения такая же, как и для других t-критериев.

Из приведенного выше равенства дисперсий значение p составляет 0,0187, что меньше 0,05, мы заключаем, что дисперсии значительно различаются. Приведенный выше результат показывает, что существует статистически значимая разница между средним баллом по письму для мужчин и женщин (t = -3,73, p = 0,0003). Другими словами, женщины имеют статистически значимо более высокий средний балл по письму (54,991), чем мужчины (50,121).

2. Парный двухвыборочный t-тест

Он используется, когда у вас есть два связанных наблюдения (т. Е. Два наблюдения на каждого субъекта), и вы хотите увидеть, отличаются ли средние значения этих двух нормально распределенных интервальных переменных друг от друга.

Проверка письма и чтения

Значение p составляет ›0,05. Приведенный выше результат показывает, что среднее значение чтения не отличается статистически значимо от среднего значения записи.

2) Z-тест

Z-тест - это статистический тест, в котором применяется нормальное распределение, и он в основном используется для решения проблем, связанных с большими выборками, когда частота больше или равна 30. Он используется, когда известно стандартное отклонение генеральной совокупности. Если размер выборки меньше 30, применим t-критерий.

В процессе SAS t-тест учитывает размер выборки и дает соответствующие результаты. В SAS нет специального кода для z-теста.

3) Дисперсионный анализ (ANOVA)

Это набор статистических моделей, используемых для анализа различий между средними значениями групп или дисперсиями.

Односторонний дисперсионный анализ

Односторонний дисперсионный анализ (ANOVA) используется, когда у вас есть категориальная независимая переменная (с двумя или более категориями) и нормально распределенная интервальная зависимая переменная, и вы хотите проверить различия в средних значениях зависимой переменной с разбивкой по уровни независимой переменной.

В SAS это делается с помощью PROC ANOVA

Здесь я хотел бы проверить, различается ли среднее значение записи для трех типов программ (prog). Prog - это категориальная переменная.

Среднее значение зависимой переменной (записи) значительно различается между уровнями типа программы. Однако мы не знаем, существует ли разница только между двумя уровнями или всеми тремя уровнями. Мы также можем видеть, что учащиеся академической программы (уровень программы 2 - ›Академическая программа) имеют самый высокий средний балл по письму, а учащиеся по профессиональной программе - самый низкий. (уровень программы 1 - ›Профессиональное)

Двусторонний дисперсионный анализ

Двусторонний дисперсионный анализ ANOVA - это тип дизайна исследования с одной числовой переменной результата и двумя категориальными независимыми переменными.

Здесь укажите как зависимую переменную, а женский и социально-экономический статус (ses) как независимые переменные. Мы хотели бы проверить письменные различия у женщин и девочек.

Эти результаты показывают, что общая модель статистически значима (F = 8,39, p = 0,0001). Переменные женский и ses статистически значимы (F = 14,55, p = 0,0002 и F = 5,31, p = 0,0057, соответственно).

4) Корреляция Пирсона (r)

Корреляция полезна, когда вы хотите увидеть линейную зависимость между двумя (или более) нормально распределенными интервальными переменными.

Мы можем запустить корреляцию между двумя непрерывными переменными, считываемыми и записываемыми в нашем наборе данных.

Мы видим, что корреляция между чтением и записью составляет 0,59678. Возведя корреляцию в квадрат и затем умножив на 100, мы можем узнать, какой процент вариабельности является общим. Округлим 0,59678 до 0,6, что в квадрате будет 0,36, умноженное на 100, будет 36%. Следовательно, чтение разделяет около 36% своей изменчивости с помощью записи.

Я объясню непараметрический тест в своей следующей статье.

Продолжайте учиться и следите за новостями!

Ссылка:

  1. Https://stats.idre.ucla.edu/sas/