Итак, я давно планировал написать технические статьи, но почему-то это всегда откладывалось, пока один университет не попросил меня сделать это😂😂. Я надеюсь, что это первый из многих

Прежде чем я начну, ELI5 (Объясни, как будто мне 5 лет) — отличный способ узнать что-то новое.

Во-первых, давайте разберемся с некоторой базовой вероятностью:

Очень просто: вероятность выпадения четырех на кубике = 1/6.

Типы событий:

Независимые события: выпадение 4 на кубике и выпадение орла на монете. Исход одного не зависит от исхода другого

Зависимые события: «Подготовка к экзамену» и «Неудача на экзамене» или «Количество облаков» и событие «Дождь». Просто эти события зависят друг от друга.

Взаимоисключающие события: если может произойти одно и только одно событие из нескольких событий, то эти события являются взаимоисключающими друг для друга. Например: «Попадание 6» и «Попадание 4».

Давайте возьмем простой пример, где у нас есть некоторая статистика обо всех людях в нашем районе, у которых недавно была лихорадка, и о симптомах, которые у них были.

Вещи, которые мы знаем:

  • Вероятность страха = 0,2
  • Вероятность кашля при лихорадке = 0,8.
  • Вероятность кашля при отсутствии температуры = 0,25.

Простым способом нарисовать это будет следующая блок-схема:

Теперь, если, учитывая приведенный выше график, я должен был спросить вас, какова вероятность того, что у вас будет кашель?

P(cough) — общая вероятность кашля. У человека есть только две возможности заболеть кашлем: либо у него жар, и он кашляет, либо у него нет жара, и у него кашель.

Давайте посмотрим на первый случай: у людей жар и кашель.

P(кашель | лихорадка) — это вероятность того, что у человека может быть кашель, если у него уже есть лихорадка. Это означает, что если у вас высокая температура, то с вероятностью 70% у вас будет кашель. Итак, если вы этого не понимаете, не думайте слишком много, просто прочитайте еще раз.

Теперь вероятность заболеть лихорадкой в ​​первую очередь в 0,2. Итак, есть 20% шанс заболеть лихорадкой, и мы знаем, что если у человека жар, то есть 70% шанс, что у него будет кашель.

Итак, допустим, поблизости есть 100 человек, мы можем сказать, что, вероятно, у 20 из них будет лихорадка. Теперь из тех людей, у которых температура, 70%, вероятно, должны иметь кашель. Таким образом, у 70% из 20 человек с температурой будет кашель. То есть 0,7*20 = 14 человек.

Итак, что мы в основном сделали здесь, так это умножили P(лихорадка) * P(кашель | лихорадка), чтобы получить вероятность наличия лихорадки и кашля.

Если вы до сих пор не поняли, вы, вероятно, слишком много думали, поэтому я бы посоветовал вам сделать передышку и прочитать все это снова, без какого-либо стресса.

Теперь мы знаем вероятность наличия лихорадки и кашля.

Точно так же вероятность отсутствия лихорадки и кашля будет равна P(нет лихорадки) * P(кашель | нет лихорадки) = 0,8 * 0,25 = 0,2. Используя приведенную выше аналогию, должно быть 80 * 0,25 = 20 человек, у которых есть кашель, но нет лихорадки.

Поскольку есть только две возможности возникновения кашля: либо (кашель + лихорадка), либо (кашель + отсутствие температуры). Общая вероятность кашля будет суммой этого.

При этом мы можем сказать:

P(кашель) = P(кашель | лихорадка) * P(лихорадка) + P(кашель | нет температуры) * P(нет температуры)

Теперь, если мы хотим знать P (лихорадка | кашель). Это будет означать количество людей, у которых есть лихорадка, учитывая, что у них есть кашель. Т.е. если у вас кашель, то есть вероятность, что у вас жар.

Итак, в подмножестве людей, страдающих кашлем, у скольких из них будет лихорадка.

Так что мы бы сделали, (вероятность лихорадки и кашля) / (вероятность кашля). По сути, это дает нам теорему Байеса