Проверка гипотез позволяет нам делать выводы о параметрах совокупности, используя данные из выборки. Чтобы проверить гипотезу в статистике, мы должны выполнить следующие шаги:

  1. Сформулируйте нулевую гипотезу и альтернативную гипотезу о параметрах
    совокупности.
  2. Постройте статистику для проверки выдвинутой гипотезы.
  3. Определите правило принятия решения, отклонять или не отклонять нулевую гипотезу.

Далее мы рассмотрим каждый из этих шагов.

Формулировка нулевой гипотезы и альтернативной гипотезы.

Прежде чем устанавливать, как сформулировать нулевую и альтернативную гипотезы, давайте проведем различие между простыми гипотезами и составными гипотезами. Гипотезы, основанные на одном или нескольких равенствах, называются простыми гипотезами. Гипотезы называются составными, если они сформулированы с использованием операторов «неравенство», «больше, чем» и «меньше, чем».

Очень важно отметить, что проверка гипотез всегда касается параметров популяции. Проверка гипотез подразумевает принятие решения на основе выборочных данных о том, следует ли отрицать, что определенные ограничения удовлетворяются базовой предполагаемой моделью. Ограничения, которые мы собираемся проверить, известны как нулевая гипотеза, обозначаемая H₀. Таким образом, нулевая гипотеза - это утверждение о параметрах популяции.

Хотя можно составить составные нулевые гипотезы, в контексте регрессионной модели нулевая гипотеза всегда является простой гипотезой. То есть, чтобы сформулировать нулевую гипотезу, которая будет называться H₀, мы всегда будем использовать оператор «равенство». Каждое равенство подразумевает ограничение на параметры модели. Давайте посмотрим на несколько примеров нулевых гипотез относительно регрессионной модели:

  • H₀ : β₁ =0
  • H₀ : β₁ + β₂ =0
  • H₀ : β₁ =β₂ =0
  • H₀ : β₂ +β₃ =1

Мы также определим альтернативную гипотезу, обозначенную H₁, которая будет нашей, если экспериментальный тест покажет, что H₀ ложно. Хотя альтернативные гипотезы могут быть простыми или составными, в регрессионной модели мы всегда будем принимать составную гипотезу в качестве альтернативной. Эта гипотеза, которая будет называться H₁, в большинстве случаев формулируется с использованием оператора «неравенство».

Так, например, при H₀: βⱼ = 1, мы можем сформулировать следующее:

  • H₁: βⱼ≠1

которая является гипотезой «двусторонней альтернативы».
Следующие гипотезы называются гипотезами «односторонней альтернативы»:

  • H₁: βⱼ<1

и

  • H₁: βⱼ>1

Статистика теста

Тестовая статистика - это функция случайной выборки и, следовательно, случайная величина. Когда мы вычисляем статистику для данной выборки, мы получаем результат тестовой статистики. Чтобы выполнить статистический тест, мы должны знать распределение тестовой статистики при нулевой гипотезе. Это распределение во многом зависит от допущений, сделанных в модели. Если спецификация модели включает предположение о нормальности, то подходящим статистическим распределением является нормальное распределение или любое из распределений, связанных с ним, например, хи-квадрат, t Стьюдента или F.

Статистика, используемая для теста, построена с учетом H₀ и выборочных данных. На практике, поскольку σ² всегда неизвестно, мы будем использовать распределения t и F.

Правило принятия решения

Мы рассмотрим два подхода к проверке гипотез: классический
подход и альтернативный подход, основанный на p-значениях. Но прежде чем увидеть, как применять правило принятия решения, мы рассмотрим типы ошибок, которые могут быть сделаны при проверке гипотез.

Типы ошибок при проверке гипотез

При проверке гипотез мы можем допустить два типа ошибок: ошибка типа I и ошибка типа II.

Ошибка I типа
Мы можем отклонить H₀, если это действительно так. Это называется ошибкой I типа. Как правило,
мы определяем уровень значимости (α) теста как вероятность совершения ошибки типа I. Символично,

α = Pr (Отклонить H₀ | H₀)

Другими словами, уровень значимости - это вероятность отклонения H₀ при условии, что H₀ верно. Правила проверки гипотез построены таким образом, что вероятность ошибки типа I достаточно мала. Общие значения для α - 0,10, 0,05 и 0,01, хотя иногда также используется 0,001. После того, как мы приняли решение отклонять H₀ или нет, мы либо приняли правильное решение, либо допустили ошибку. Мы никогда не узнаем с уверенностью, была ли допущена ошибка. Однако мы можем вычислить вероятность возникновения ошибки типа I или типа II ошибки.

Ошибка типа II
Мы можем не отклонить H₀, если оно на самом деле ложно. Это называется ошибкой типа II.

β = Pr (без отклонения H₀ | H₁)

Проще говоря, β - это вероятность не отклонить H₀ при условии, что H₁ истинно. Невозможно минимизировать оба типа ошибок одновременно. На практике мы выбираем низкий уровень значимости.

Классический подход: реализация решающего правила

Классический подход предполагает следующие этапы:

1) Выбор α . Классическая проверка гипотез требует, чтобы мы изначально указали
уровень значимости для теста. Когда мы указываем значение для
α , мы, по сути, количественно определяем нашу терпимость к ошибке типа I. Если α = 0,05, то исследователь готов ошибочно отклонить H₀ 5% случаев.

2) Получение c критического значения с помощью статистических таблиц. Значение c
определяется
α . Критическое значение c для проверки гипотезы - это порог, с которым сравнивается значение статистики теста в выборке, чтобы определить, отклонена ли нулевая гипотеза.

3) Сравнивая результат теста статистики s с c , H₀ либо отклоняется или нет для данного α .

Область отклонения (RR), ограниченная критическим значением (s), представляет собой набор значений тестовой статистики, для которых отклоняется нулевая гипотеза. То есть пространство выборки для тестовой статистики разделено на две области; одна область (область отклонения) приведет нас к отклонению нулевой гипотезы H₀, в то время как другая заставит нас не отклонять нулевую гипотезу. Следовательно, если наблюдаемое значение тестовой статистики S находится в критической области, мы делаем вывод, отклоняя H₀; если он не находится в области отклонения, мы делаем вывод, не отклоняя H₀ или не отклоняя H₀. Символично,

Если s ≥c, отклонять H₀
Если s ‹c, не отклонять H₀

Если нулевая гипотеза отклоняется вместе с доказательствами выборки, это сильный вывод. Однако принятие нулевой гипотезы - это слабый вывод, потому что мы не знаем, какова вероятность не отклонить нулевую гипотезу, когда ее следует отвергнуть. То есть мы не знаем вероятность ошибки типа II. Следовательно, вместо того, чтобы использовать выражение принятия нулевой гипотезы, правильнее сказать не отклонять нулевую гипотезу или не отклонять, поскольку на самом деле происходит то, что у нас недостаточно эмпирических данных, чтобы отвергнуть нулевую гипотезу.

В процессе проверки гипотез наиболее субъективной частью является априорное
определение уровня значимости. Какие критерии можно использовать для его определения? В общем, это произвольное решение, хотя, как мы уже сказали, на практике чаще всего используются уровни 1%, 5% и 10% для α. Иногда тестирование обусловлено несколькими уровнями значимости.

Альтернативный подход: p-значение

С использованием компьютеров проверку гипотез можно рассматривать с более рациональной точки зрения. Компьютерные программы обычно предлагают вместе со статистикой теста вероятность. Эта вероятность, которая называется p-значением (т. Е. Значением вероятности), также известна как критический или точный уровень значимости или точная вероятность совершения ошибки типа I. С технической точки зрения, значение p определяется как самый низкий уровень значимости, при котором нулевая гипотеза может быть отклонена.

После определения значения p мы знаем, что нулевая гипотеза
отклоняется для любого значения α≥p-, а нулевая гипотеза не отклоняется. когда значение
α ‹p-. Следовательно, значение p является индикатором уровня допустимости нулевой гипотезы: чем выше значение p, тем больше у нас доверия к нулевой гипотезе. . Использование значения p полностью меняет вопрос проверки гипотез. Таким образом, вместо фиксации априорного уровня значимости, вычисляется p -значение, чтобы мы могли определить уровни значимости тех, в которых нулевая гипотеза отклоняется.

Вывод

Это был краткий обзор проверки гипотез с помощью p-значений, который, я думаю, пригодится новичкам, которые хотят заняться статистикой или наукой о данных.

Надеюсь, этот пост был полезен. Дай мне знать в комментариях! Спасибо!