В предыдущем посте мы рассмотрим, как мы строим проверку гипотез и эксперименты. В этом посте мы начнем рассматривать конкретные методы для этого. Первый метод, который мы собираемся изучить, - это Z-тест.

Выборочное распределение

перед Z-тестом нам нужно знать, что такое выборочное распределение и как мы можем его построить. Распределение выборки - это вероятностное распределение статистики, полученной из большего числа выборок, взятых из определенной совокупности. Это можно сделать тремя способами:

  1. Моделирование, многократное проведение эксперимента. = ›Подбрасывание монеты.
  2. Аналитически мы знаем базовое распределение достаточно, чтобы построить выборочное распределение. = ›Мы измеряем вес или симметрию монеты и вычисляем распределение выборки с помощью статистических методов.
  3. Центральная предельная теорема, когда среднее является параметром, который мы собираемся оценить. Независимо от основного распределения, в котором отрисовываются данные, выборочное распределение будет нормальным распределением. Среднее значение выборочного распределения будет средним для генеральной совокупности. Стандартное отклонение будет равно σ / корень из числа выборки. Таким образом, чем больше размер выборки, тем уже будет распределение выборки.

Советы. Стандартное отклонение выборочного распределения от CLT также называется стандартной ошибкой. Когда n больше 30, мы практически называем его достаточно большим, потому что стандартная ошибка мала. Однако базовое распределение имеет очень высокую дисперсию, нам нужны очень большие выборки. В этом случае мы можем решить проблему высокой дисперсии в базовом распределении, используя разбиение данных. Удаляет небольшие вариации данных.

Что мы собираемся делать:

Допустим, вы подбрасываете монету, и голова появляется 40 раз в 100 попытках. Можно ли сказать, что монета справедливая? Допустим, вы подбрасываете монету, и голова появляется 10 раз в 100 попытках. Можно ли сказать, что монета справедливая ?? Если вы нормальный человек, вы должны обвинить в игре дилера. Как ты это чувствуешь? Как вы это оцениваете? Мы пытаемся сделать этот вывод с помощью формального языка и математики. Это то, что мы собираемся делать. Это почти все. Нулевая гипотеза будет состоять в том, что монета справедлива, а альтернативная гипотеза будет заключаться в том, что монета не справедлива.

Формальный способ:

  1. мы строим распределение при условии, что нулевая гипотеза верна, монета пара. рассчитайте всю вероятность выпадения головы, когда вы подбрасываете монету 100 раз. вероятность от 1 до 100 голов легко подсчитать.
  2. Проведение эксперимента с монетой, подбрасывание 100 раз и запись головы.
  3. Сопоставьте эксперимент с распределением и посмотрите вероятность. Если вам не нравится эта вероятность (значение p), вы отвергаете свою нулевую гипотезу.

Примечание. Если вы ошиблись с альтернативной гипотезой, все результаты могут оказаться бесполезными.

Z-тест

Он специально использует выборочное распределение среднего из CLT. Давайте посмотрим на это на примере. Предположим, я профессор, какое прекрасное будущее. Я знаю, сколько времени у моих учеников уйдет на решение задачи, и есть новая проблема, которую раньше не видели, но моим ученикам требуется в 2,8 раза больше времени, чем предыдущая задача. Я хочу знать, что новая проблема сложнее предыдущей.

H0: предыдущая проблема и новая проблема одинаковы.

H1: новая проблема сложнее предыдущей.

Допустим, я знаю, что среднее и стандартное отклонение времени, затрачиваемого студентом на решение предыдущей задачи, = ›1,0 и 0,948.

Поскольку я буду известным профессором, я даю студентам новую задачу, чтобы решить ее и записать время. Его результаты: среднее значение = 2,8 (N = 25).

Мы смотрим на среднее. Следовательно, распределение выборки будет соответствовать случаю CLT, это означает, что это нормальное распределение, среднее значение равно 1,0, а стандартное отклонение составляет 0,948 / 5. Какова вероятность результата на основе выборочного распределения? Мы можем рассчитать с этим распределением. Однако мы можем рассчитать его в несколько более удобной форме. Он вычисляет Z-оценку, поэтому мы называем этот тест Z-тестом.

Мы преобразуем выборочное распределение в стандартное нормальное распределение, среднее значение равно 0, а стандартное стандартное распределение следует за единицей стандартного отклонения. В нашем случае Z-оценка составляет 9,47 ((2,8–1,0) / 0,19).

Вы можете найти вероятность в таблице Z-score. Вероятность нашего слишком мала. Невозможно выразить это на одной странице. В этой таблице есть известные числа: 1,65, 1,96 и 2,575. Это соответствует 10%, 5% 1% в одном хвосте, вам нужно знать, что для этого нужен только один хвост.

Мы отлично закончили наш эксперимент. Как вы думаете, сможете ли вы отвергнуть нулевую гипотезу? Думаю, этого достаточно. Во многих случаях специалист по анализу данных следует за 1,96, 0,05 или 2,575, 0,01 (p-значение). Итак, мы отклоняем нулевую гипотезу, и мой ученик может сказать мне изменить экзамен.

Примечания: p-значение означает вероятность того, что я ошибаюсь, когда принимаю решение и отклоняю нулевую гипотезу. Мы предполагаем многое. Таким образом, мы должны следить за малым p-значением.

Этот пост опубликован 09.09.2020