Вероятность и статистика — это разделы математики, которые занимаются анализом и интерпретацией данных, предсказаниями и пониманием неопределенности. Вероятность – это изучение неопределенности и вероятности наступления событий. Он количественно оценивает шансы возникновения различных результатов, в то время как статистика включает в себя сбор, анализ, интерпретацию и представление данных. Он предоставляет методы для извлечения значимой информации из наборов данных и получения выводов.

Давайте начнем с понимания того, как они влияют на нашу повседневную жизнь.

Планирование мероприятий на свежем воздухе. Прогнозы погоды дают нам информацию о вероятности различных погодных условий, таких как дождь, снег или солнце. Понимая прогнозируемые вероятности, мы можем соответствующим образом планировать мероприятия на свежем воздухе. Например, если велика вероятность дождя, мы можем взять с собой зонт или перенести пикник.

Энергопотребление. Прогнозы погоды играют важную роль в управлении энергопотреблением. Например, спрос на электроэнергию зависит от погодных условий. Основанные на вероятности прогнозы экстремальных температур или штормов помогают поставщикам энергии оценивать пиковый спрос, управлять энергоснабжением и предотвращать перебои в подаче электроэнергии.

Экономическая политика: правительства полагаются на экономическую статистику и вероятностные модели для формирования экономической политики. Эти статистические данные включают такие показатели, как рост ВВП, уровень инфляции, показатели занятости и данные о торговле. Статистический анализ помогает политикам понимать экономические тенденции, оценивать влияние политики и принимать обоснованные решения в отношении фискальных и монетарных мер.

Политика общественного здравоохранения. Вероятность и статистика играют решающую роль в формировании политики и мер общественного здравоохранения. Эпидемиологические исследования и статистическое моделирование помогают чиновникам общественного здравоохранения понимать закономерности заболеваний, оценивать влияние вмешательств и прогнозировать распространение инфекционных заболеваний, например, это помогло в случае с Covid-19. Эта информация влияет на решения, связанные со стратегиями вакцинации, карантинными мерами и распределением ресурсов здравоохранения, что в конечном итоге направлено на защиту и улучшение здоровья населения.

Анализ преступности и общественная безопасность. Вероятность и статистика используются при анализе преступности и планировании общественной безопасности. Статистические методы помогают выявлять закономерности преступности, анализировать уровень преступности и эффективно распределять ресурсы. Правительства могут использовать эту информацию для развертывания сотрудников правоохранительных органов, разработки стратегий предотвращения преступности и усиления мер общественной безопасности.

Хорошо, теперь мы достаточно поняли его влияние на нашу повседневную жизнь, давайте разберемся с некоторыми основными понятиями вероятности и статистики. Начнем

Центральные тенденции, они используются для представления набора данных только с одной точкой данных. Это среднее, мода и медиана. И когда использовать то, что он понял, используя стандартное отклонение, дисперсию и т. д.

Среднее: в статистике среднее значение является мерой центральной тенденции, которая представляет собой среднее значение набора чисел. Чтобы вычислить среднее значение, вы складываете все числа в наборе данных, а затем делите сумму на общее количество значений.

Среднее значение обычно используется для обобщения данных и предоставления репрезентативного значения для набора данных. Их ограничение заключается в том, что они чувствительны к выбросам (значение, резко отличающееся от большинства наборов данных).

Мода представляет наиболее часто встречающееся значение в наборе данных.

Медиана представляет собой среднее значение набора данных, когда он расположен в порядке возрастания или убывания. Он делит данные на две равные половины, при этом 50% значений ниже и 50% выше медианы.

Когда что использовать?

Среднее значение часто используется при работе с числовыми данными и когда набор данных следует относительно симметричному распределению (это означает, что точки данных в наборе данных не сильно разбросаны) без экстремальных выбросов.

Используйте режим при работе с категориальными данными или при определении наиболее распространенного значения или категории.

Используйте медиану при работе с искаженными данными (набор данных, в котором значительное количество точек данных сосредоточено рядом с точкой данных, которая не является средней или не представляет весь набор данных), данными с экстремальными значениями или когда требуется устойчивость к выбросам.

Теперь давайте узнаем о стандартном отклонении и дисперсии.

Стандартное отклонение: количественно определяет среднюю величину, на которую отдельные значения в наборе данных отклоняются от среднего значения. Более высокое стандартное отклонение указывает на большую изменчивость или дисперсию, а более низкое стандартное отклонение указывает на меньшую изменчивость. Стандартное отклонение представляет собой квадратный корень дисперсии.

Дисперсия: Подобно стандартному отклонению, дисперсия также является мерой того, насколько отдельные значения в наборе данных отклоняются от среднего значения. Дисперсия рассчитывается путем получения среднего значения квадратов различий между каждым значением и средним значением. Но дисперсия пригодится, когда набор данных чувствителен к выбросам.

Распределение вероятностей: Распределение вероятностей описывает вероятность различных результатов или событий, происходящих в случайном эксперименте или процессе. Он предоставляет математическую функцию или таблицу, которая присваивает вероятности различным возможным значениям или диапазонам значений.

Давайте рассмотрим пример броска правильного шестигранного кубика, чтобы лучше понять вышеприведенные концепции.

В этом случае при бросании честного шестигранного кубика каждая грань имеет равную вероятность 1/6 выпадения.

Ожидаемое среднее = (1 * 1/6) + (2 * 1/6) + (3 * 1/6) + (4 * 1/6) + (5 * 1/6) + (6 * 1/6) = 3,5

Среднее значение в этом случае равно 3,5, что представляет собой средний результат, ожидаемый при многократном бросании игральной кости.

В случае честного шестигранного кубика, поскольку значения колеблются от 1 до 6, медиана является средним из двух средних значений: 3 и 4. Итак, медиана равна (3 + 4)/2 = 3,5.

Медиана такая же, как и среднее значение в этом примере, что указывает на то, что распределение является симметричным и равномерно сбалансированным. В этом случае, поскольку каждая грань кости имеет одинаковую вероятность, единственной моды нет. поэтому все результаты являются модами.

Дисперсия = [(1–3,5)² * 1/6] + [(2–3,5)² * 1/6] + [(3–3,5)² * 1/6] + [(4–3,5)² * 1 /6] + [(5–3,5)² * 1/6] + [(6–3,5)² * 1/6] = 2,92

Дисперсия в этом случае составляет примерно 2,92, что указывает на степень изменчивости результатов при бросании игральной кости.

И стандартное отклонение будет около 1,7, что указывает на то, что результат может сильно отличаться от ожидаемого среднего результата 3,5.