Когда больше данных плохо 😱😱😨

Фактор Байеса

Это фактор Байеса:

Это отношение вероятностей двух гипотез. Это соотношение говорит нам о вероятности того, что мы видели, учитывая то, что мы считаем правдой, по сравнению с тем, что кто-то другой считает правдой. Наша гипотеза побеждает, если она лучше объясняет мир, чем конкурирующая гипотеза.

Нам также потребуется объединить фактор Байеса и априорные шансы (записанные как O (H_1):

Это помогло бы нам рассчитать, во сколько раз наша гипотеза может объяснить данные лучше, чем конкурирующая гипотеза.

Пример

Предположим, вы шли, и вдруг у вас возникла боль в груди и в шее. Итак, вы решили поискать в Google потенциальные причины ваших симптомов и пришли к двум возможным гипотезам:

Изжога: когда желудочная кислота забрасывается в пищевод. Вы можете не лежать и принимать лекарства для облегчения симптомов.

Сердечный приступ: «блокировка притока крови к сердечной мышце». Скорее всего, вам потребуется лечь в больницу.

Из этих двух причин больше всего беспокоит сердечный приступ. Да, это может быть просто изжога и ничего больше, но что, если это не так? Поскольку вас больше всего беспокоит возможность сердечного приступа, вы решаете сделать это своим H_1. Ваш H_2 — это гипотеза о том, что у вас изжога.

Мы начнем с рассмотрения вероятности этих гипотез и вычислим P(D | H). Вы заметили два симптома: боль в груди и боль в шее.

Следующие числа данных выдуманы.

При сердечных приступах вероятность боли в груди составляет 97 процентов, а вероятность боли в шее — 76 процентов. Таким образом, вероятность наличия обоих равна:

Поскольку я не могу писать уравнения на среде, вам придется прочитать их в моем подстеке здесь: https://ivanh.substack.com/p/what-is-bayesian-statistics-the-beginner-895.