Распределение вероятностей - это функция, описывающая вероятность получения возможных значений, которые может принимать случайная величина. Другими словами, значения переменной зависят от лежащего в основе распределения вероятностей.

Импортируйте необходимые библиотеки:

Существуют разные типы распределения вероятностей, которые служат разным целям и представляют разные процессы генерации данных.

Мы собираемся изучить самые основные дистрибутивы:

1) Биномиальное распределение

  • Широко используется распределение вероятностей дискретной случайной величины.
  • Играет важную роль в функции контроля и обеспечения качества.

  • где P (X = x) - вероятность получить x успехов в n испытаниях, а 𝜋 π - вероятность интересующего события.

Некоторые важные функции в Python для биномиального распределения:

1) Вероятностная функция масс

scipy.stats.binom.pmf дает функцию массы вероятности для биномиального распределения.

биномиальный = scipy.stats.binom.pmf (k, n, p),

  • где k - массив и принимает значения в {0, 1,…, n}
  • n и p - параметры формы для биномиального распределения

Выходные данные, биномиальные, дают вероятность биномиальной функции распределения в терминах массива.

2) Функция кумулятивной плотности

cumbinomial = scipy.stats.binom.cdf (k, n, p) дает кумулятивное биномиальное распределение.

Результат, cumbinomial, дает кумулятивную вероятность биномиальной функции распределения в терминах массива.

3) Постройте биномиальную функцию плотности

Функция matplotlib.pyplot.plot (k, binomial, ‘o-’) дает нам график функции биномиального распределения.

Пример:

Компания-производитель светодиодных ламп регулярно проводит проверки качества продукции, которую она производит, в определенные периоды. Исторически, процент отказов светодиодных ламп, которые производит компания, составляет 5%. Допустим, выбрана случайная выборка из 10 светодиодных лампочек.

Какова вероятность того, что
а) Ни одна из светодиодных ламп не неисправна?
б) Одна из светодиодных ламп неисправна?
в) Две или меньше светодиодных ламп неисправны?
г) Неисправны три или более светодиодных лампы.

Распределение Пуассона:

  • Это дискретное распределение, которое также играет важную роль в контроле качества.
  • Распределение Пуассона - это дискретное распределение вероятностей для количества событий, которые происходят случайным образом в заданном интервале времени или пространства. В таких областях возможностей может быть более одного случая. В таких ситуациях для вычисления вероятностей можно использовать распределение Пуассона.
  • Примеры включают количество дефектов на единицу, количество дефектов на произведенный трансформатор.
  • Примечания: Распределение Пуассона помогает прогнозировать скорость прибытия в ситуации очереди, когда очередь формируется, и люди ждут обслуживания, а скорость обслуживания обычно выше, чем скорость прибытия.

Свойства:
* Среднее μ = λ
* Стандартное отклонение σ = √ μ
* Распределение Пуассона - это предел биномиального распределения, когда n приближается к ∞ и p приближается к 0

Некоторые важные функции в Python для решения задач распределения Пуассона

1) Вероятностная массовая функция:

poisson = scipy.stats.poisson.pmf (n, rate), где n - это где n - массив, такой как квантили, а rate - среднее значение. Он дает результат распределения Пуассона в форме массива.

2) Функция совокупной плотности:

poisson = scipy.stats.poisson.cdf (n, rate), где n - это где n - массив, такой как квантили, а rate - среднее значение. Он дает результат кумулятивной функции плотности в форме массива.

Пример:

Количество производственных травм в месяц на производственном предприятии, как известно, подчиняется распределению Пуассона, в среднем 2,5 производственных травм в месяц. Какова вероятность того, что в данном месяце

а) Нет производственных травм?

б) Произошла хотя бы одна производственная травма?

Нормальное распределение

  • Одно из самых популярных непрерывных распределений в области аналитики.
  • Нормальное распределение наблюдается по многим естественным показателям, таким как вес при рождении, рост, интеллект и т. Д.

Где

  • f (x) используется для представления функции плотности вероятности
  • x - любое значение непрерывной переменной, где -∞ ‹x‹ ∞

  • e обозначает математическую константу, приближенную к 2,71828
  • Π - математическая константа, приблизительно равная 3,14159.
  • μ и σ - среднее и стандартное отклонение нормального распределения.

Характеристики:

  1. Теоретические нормальные функции плотности определены между -∞ и ∞.
  2. Есть два параметра: местоположение (μ - среднее значение) и масштаб (σ - стандартное отклонение).
  3. Он имеет симметричный (колоколообразный) вид вокруг среднего. среднее = медиана = режим
  4. Области между конкретными значениями измеряются в единицах μ и σ.
  5. Любое линейное преобразование, если нормальная случайная величина также является нормальной случайной величиной.
  6. Если X1 - независимая нормальная случайная величина со средним μ1 и дисперсией 𝜎 12σ12, а X2 - другая независимая нормальная случайная величина со средним μ2 и 𝜎 22σ22, то X1 + X2 также нормальное распределение со средним μ1 + μ2 и дисперсией 𝜎 12σ12 + 𝜎 22σ22

Пример:

Было проведено исследование использования смартфонов в Индии, и было обнаружено, что пользователи смартфонов тратят в среднем 68 минут в день на отправку сообщений, а соответствующее стандартное отклонение составляет 12 минут. Предположим, что время, затрачиваемое на отправку сообщений, соответствует нормальному распределение.

а) Какая часть пользователей смартфонов тратит более 90 минут на отправку сообщений ежедневно?

б) Какая часть клиентов тратит менее 20 минут?

в) Какая часть клиентов тратит от 50 до 100 минут?

Спасибо и продолжайте учиться :)