Когда больше данных плохо 😱😱😨
Фактор Байеса
Это фактор Байеса:
Это отношение вероятностей двух гипотез. Это соотношение говорит нам о вероятности того, что мы видели, учитывая то, что мы считаем правдой, по сравнению с тем, что кто-то другой считает правдой. Наша гипотеза побеждает, если она лучше объясняет мир, чем конкурирующая гипотеза.
Нам также потребуется объединить фактор Байеса и априорные шансы (записанные как O (H_1):
Это помогло бы нам рассчитать, во сколько раз наша гипотеза может объяснить данные лучше, чем конкурирующая гипотеза.
Пример
Предположим, вы шли, и вдруг у вас возникла боль в груди и в шее. Итак, вы решили поискать в Google потенциальные причины ваших симптомов и пришли к двум возможным гипотезам:
Изжога: когда желудочная кислота забрасывается в пищевод. Вы можете не лежать и принимать лекарства для облегчения симптомов.
Сердечный приступ: «блокировка притока крови к сердечной мышце». Скорее всего, вам потребуется лечь в больницу.
Из этих двух причин больше всего беспокоит сердечный приступ. Да, это может быть просто изжога и ничего больше, но что, если это не так? Поскольку вас больше всего беспокоит возможность сердечного приступа, вы решаете сделать это своим H_1. Ваш H_2 — это гипотеза о том, что у вас изжога.
Мы начнем с рассмотрения вероятности этих гипотез и вычислим P(D | H). Вы заметили два симптома: боль в груди и боль в шее.
Следующие числа данных выдуманы.
При сердечных приступах вероятность боли в груди составляет 97 процентов, а вероятность боли в шее — 76 процентов. Таким образом, вероятность наличия обоих равна:
Поскольку я не могу писать уравнения на среде, вам придется прочитать их в моем подстеке здесь: https://ivanh.substack.com/p/what-is-bayesian-statistics-the-beginner-895.