Применение функции mean()

В R применение функции mean() к логическому вектору возвращает пропорцию элементов, которые равны TRUE. Очень часто для расчета вероятностей используется функция mean(), и мы будем делать это на протяжении всего курса.

Предположим, у вас есть вектор beads из предыдущего видео:

beads <- rep(c("red", "blue"), times = c(2,3))
beads
[1] "red" "red" "blue" "blue" "blue"

Чтобы найти вероятность случайного вытягивания синей бусины, вы можете запустить:

mean(beads == "blue")
[1] 0.6

Этот код разбит на шаги внутри R. Сначала R оценивает логический оператор beads == "blue", который генерирует вектор:

FALSE FALSE TRUE TRUE TRUE

Когда применяется функция mean, R приводит логические значения к числовым значениям, изменяя TRUE на 1 и FALSE на 0:

0 0 1 1 1

Таким образом, среднее значение нулей и единиц дает пропорцию TRUE значений. Как мы узнали и продолжим видеть, вероятности напрямую связаны с долей событий, удовлетворяющих требованию.

В R функция mean может использоваться для вычисления среднего числового вектора. Чтобы использовать его для вероятности, вы должны предоставить вектор числовых значений, представляющих распределение вероятностей случайной величины, и функция mean вернет ожидаемое значение (также известное как среднее значение или первый момент) этого распределения.

Вот пример:

> x <- c(0.1, 0.2, 0.3, 0.4)
> mean(x)
[1] 0.25

В этом примере показано, как использовать функцию mean для вычисления ожидаемого значения дискретного распределения вероятностей с 4 исходами и вероятностями 0.1, 0.2, 0.3 и 0.4. Результатом является 0.25, что является ожидаемым значением распределения.