Публикации по теме 'probability'


Максимальное правдоподобие (упрощенное)
Максимальное правдоподобие — важный принцип машинного обучения и статистики. Он используется для оценки параметров многих моделей машинного обучения как для задач регрессии, так и для задач классификации. Многим из моих студентов трудно понять эту концепцию, когда они слышат о ней впервые, поэтому я решил написать короткую статью, объясняющую эту концепцию простыми словами, и привести несколько примеров. Предположим, что у нас есть набор из n точек данных, обозначенных как X = { x ₁,..

«Демистификация наивного Байеса: просто, но мощно для классификации текстов»
Уважаемый [Подписчик/Подписчик], Надеюсь, это сообщение вас удовлетворит. Хотел поделиться с вами интересной новостью. Недавно я опубликовал обширный блог под названием «Демистификация наивного байесовского метода: просто, но эффективно для классификации текста». Полное руководство для специалистов по данным» на Vocal Media. Из-за недоступности партнерской программы Medium в моей стране я решил сначала опубликовать ее на Vocal Media. Вы можете найти блог по следующей ссылке:..

Концепции вероятности для машинного обучения
Обычная переменная Обычное значение переменной не изменяется после присвоения значения. Ниже приведены несколько примеров. x = 3 z = 4 age = 44 Случайная переменная Случайная величина X — это величина, которая может иметь разные значения при каждой проверке переменной, например, при измерениях в экспериментах. Ниже приведены несколько примеров. X(значение после броска кубика) Здесь каждое значение времени может быть любым из конечного набора {1, 2, 3, 4, 5, 6}...

Пусть E(x) будет математическим ожиданием игры при условии, что последний выпал, т. е.
Скажем, у вас есть n-гранный кубик. Вы продолжаете кидать и суммировать значения до тех пор, пока текущий бросок больше, чем предыдущий. Например, если n = 6, вы можете выбросить 1, 3, 2 и остановиться или 1, 4, 5, 3 и остановиться. В первом случае ваша общая сумма равна 1 + 3 = 4, а во втором случае ваша общая сумма равна 1 + 4 + 5 = 10. Каково ожидаемое значение суммы? Пусть E(x) будет ожидаемым значением игры при условии, что последним выпало, т. е. максимальный бросок был x. E(n) =..

Предвзятость и дисперсия
За кулисами модельного обучения Пытаясь подогнать модель машинного обучения к данным, мы столкнулись бы со сценариями, в которых модель будет хорошо работать на обучающих данных, но с треском провалится на тестовых данных. В терминах машинного обучения мы назовем это переоснащением, и оно будет указано с использованием таких терминов, как смещение и дисперсия. Хотя большинство из нас понимает, что означает переоснащение, мы все еще не получаем полной картины того, что происходит на заднем..

Цепь Маркова
Введение в цепь Маркова и ее свойства Цепь Маркова — относительно простая концепция в области случайных процессов. Мы можем думать о случайном процессе как о наборе случайных величин, индексированных по времени. В качестве простого примера мы можем рассматривать серию подбрасывания монеты как случайный процесс. Каждое из подбрасываний является случайной величиной Бернулли (может принимать одно из двух состояний), и мы можем их индексировать в соответствии с порядком подбрасывания...

Подгонка данных «время до события» к модели гамма-распределения с использованием Python
И как использовать его для предсказания будущих наблюдений. Ранее я написал статью , в которой объясняю интуитивное представление о том, что такое гамма-распределение , на практическом примере (время моделирования до приземления самолета с гамма-распределением). В этой статье я объясню на практике, как сопоставить существующие данные с гамма-распределением и как использовать их для прогнозирования. Создание данных