В статистике, особенно при проверке гипотез, мы принимаем решение, принимать или отклонять определенную гипотезу, на основе P-Value.

Никакое определение этой конкретной концепции не помогло мне четко ее понять. По этой причине давайте возьмем пример и попытаемся понять, что такое P-Value?

Возьмем для примера рост африканских слонов.

Предположим, у вас есть 36 наблюдений (все в метрах, м):

[2.98, 2.92, 3.02, 3.07, 2.93, 2.92, 2.9, 2.95, 2.99, 2.91, 2.95, 2.94, 3.03, 2.92, 3.03, 3.01, 3.09, 2.98, 3.06, 3.06, 2.94, 3.01, 2.99, 2.98, 3.04, 3.08, 2.91, 3.0, 2.97, 3.0, 2.94, 2.97, 2.92, 2.93, 2.99, 2.91]

Вы отнесете его в лабораторию по исследованию животных и скажете, что у вас есть измерения роста 36 африканских слонов.

Очевидно, что предприятие не хочет принимать вашу претензию без проверки ваших измерений. Поэтому они решают запустить тест и начинают с вычисления среднего значения ваших наблюдений, которое равно 2,98 млн.

Теперь у них возникает ощущение, что среднее значение слишком низкое, но вполне возможно получить такое низкое среднее. Поэтому они решают использовать свои исторические данные об африканских слонах и выбирают 1000 образцов (с заменой) 36 размера и вычисляют среднее значение каждой из этих 1000 образцов, чтобы увидеть, насколько вероятно получить среднее значение 2,98 м или меньше.

Нулевая гипотеза: μ может составлять 2,98 м или меньше, если у вас есть эксклюзивная выборка африканских слонов.

Они выяснили, что количество раз, когда среднее значение меньше или равно 2,98 м, равно 48, и,

48 ÷ 1000 = 0.048 (4.8%)

Узнав, что вероятность получить такой низкий средний показатель (2,98 м) составляет менее 5%, они говорят вам, что ваши наблюдения вряд ли будут проводиться исключительно с африканскими слонами. Тем самым они отклоняют вашу претензию. Очень плохо!

Здесь вы должны отметить, что тот факт, что ваша жалоба была отклонена, не означает, что ваша выборка не состоит исключительно из африканских слонов. Возможно, ваша выборка уникальна, и поэтому у вас такой низкий средний показатель. Ура!

В нашем примере 5% -ный порог, принятый животноводческим учреждением, называется уровнем значимости (α). Во многих экспериментах обычно α составляет 0,05. Это означает, что если вероятность определенного наблюдения меньше 0,05, тогда маловероятно получить этот конкретный результат, но не невозможно.

Давайте посмотрим на определение:

При проверке значимости нулевой гипотезы p-значение представляет собой вероятность получения результатов теста, по крайней мере, столь же экстремальных, как и фактически наблюдаемые результаты, при условии, что нулевая гипотеза верна.

Основываясь на определении, мы предположили, что имеющаяся у нас гипотеза об исключительной выборке африканских эльфов верна, и затем мы перешли к проверке вероятности средней высоты, которая действительно наблюдалась в вашей выборке.

Спасибо за чтение!

AB