Исследовательский анализ данных помогает понять, как выявлять закономерности в данных, используя различные методы и подходы. И это также важный этап любого анализа данных.

Хотя у нас есть большой объем данных, поступающих для анализа данных, правда в том, что нам приходится работать только с небольшой частью данных. И мы используем некоторую статистику и вероятность для этих выборочных данных, чтобы сделать выводы.

Так что же такое логическая статистика? 🤔

Процесс «вывода» идей из выборочных данных называется «выводной статистикой».

Прежде чем погрузиться в мир статистики логических выводов, вам необходимо усвоить одну из ключевых вещей — представление о двух основных принципах подсчета — перестановки и комбинации.

Во-первых, мы должны знать о двух основных принципах подсчета, с помощью которых вы можете рассчитать вероятность интересующих вас исходов. Эти принципы подсчета заключаются в следующем:

  • Перестановки. Перестановка — это способ упорядочивания выбранной группы объектов таким образом, что порядок имеет значение. Например, расстановка некоторых букв в разные слова, расстановка лучших игроков с битой в команде или поиск всех способов, которыми группа друзей может рассадиться в кинозале — во всех этих методах используются перестановки. Когда есть «n» объектов, которые нужно расположить среди «r» пространств, значение перестановки определяется по следующей формуле:

нПр=н! / (n−r)!

  • Комбинации: когда вам просто нужно выбрать несколько объектов из большего набора и порядок не имеет значения, тогда правило подсчета, которое вы используете, называется комбинацией. Например, если вам нужно найти количество способов выбрать три гласных из заданного списка из пяти или выбрать четыре котелка из заданного списка из семи — все эти методы используют комбинации. Если вы хотите выбрать «r» объектов из большего набора «n» объектов, то количество способов, которыми вы можете это сделать, определяется следующей формулой:

nCr = n! / г!(п-г)!

Далее, есть некоторые специфические термины, связанные с вероятностью — события, выборочное пространство и эксперименты.

  • События. Это подмножество, т. е. часть выборочного пространства, которое должно быть истинным для вашего вероятностного эксперимента.
  • выборочное пространство:выборочное пространство — это не что иное, как список всех возможных результатов случайного эксперимента.
  • эксперименты. По сути, любой сценарий, для которого вы хотите вычислить вероятности, считается экспериментом. Он может быть детерминированным или случайным.

Теперь есть некоторые основные правила вероятности, такие как следующие:

  • Значения вероятности всегда лежат между 0 и 1.
  • Значения вероятности для всех исходов эксперимента всегда составляют в сумме 1.

Кроме того, существуют определенные типы событий, с которыми можно столкнуться при вычислении вероятностей более чем двух событий. Они следующие:

  • Независимые события. Если у вас есть два или более событий, и возникновение одного события не имеет никакого отношения к возникновению другого события/событий, то все события считаются независимыми от каждого из них. другой.
  • Непересекающиеся или взаимоисключающие события. Теперь два или более события являются взаимоисключающими, если они не происходят одновременно, т. е. когда происходит одно событие, остальные события не происходят.

Самое важное 😌,вы также узнали об идее дополнения A’ для любого события A и правиле вероятности для них, то есть P(A) + P(A’) = 1.

Далее у нас есть два основных правила вероятности, которые помогут вам найти вероятности двух или более событий. Они следующие:

  • Правило сложения. Если у вас есть отдельные вероятности двух событий A и B, обозначенные как P(A) и P(B), Правило сложения гласит, что вероятность события А или В определяется как
  • P(A∪B) = P(A) + P(B) — P(A∩B),

Где P(A∪B) обозначает вероятность того, что событие A или B произойдет.
P(A)обозначает вероятность того, что произойдет только событие A.
P(B) обозначает вероятность того, что произойдет только событие B.
P(A∩B) обозначает вероятность того, что оба события A и B произойдут одновременно.

  • Правило умножения. Когда событие A не зависит от события B и наоборот, они называются независимыми событиями. Правило умножения позволяет нам вычислить вероятности того, что оба они произойдут одновременно, что дается как:
  • P(A и B) = P(A)*P(B).

Теперь это правило можно распространить на несколько независимых событий, где все, что вам нужно сделать, — это перемножить соответствующие вероятности всех событий, чтобы получить окончательную вероятность того, что все они произойдут одновременно. Например, если у вас есть четыре независимых события A, B, C и D, то:
P(A и B, C и D) = P(A)*P(B)*P(C )*П(Д)

Наконец, сравнение между правилом сложения и правилом умножения поможет вам решить, какую формулу использовать в данном сценарии. Если в вопросе упоминается «ИЛИ» для обозначения связи между событиями, вам необходимо применить правило сложения. То есть в это время может произойти любое из заданных событий, P(событие A или событие B). В противном случае, если используется «И» для обозначения взаимосвязи между событиями, используется правило умножения. Здесь события должны происходить одновременно и должны быть независимыми, P (событие A и событие B).

И мы подошли к концу нашего обсуждения Вероятности 🍻. Я обязательно напишу несколько статей об основном машинном обучении.

Если вам нравятся мои статьи, вы всегда можете подписаться на меня. Мне нравится делиться своими знаниями и обучением.