Понимание приложений теории множеств на примере реального мира

Все мы знаем, насколько важными стали сегодня данные, и понимание лежащих в основе математических концепций является жизненно важной частью процесса изучения науки о данных.

Прочитав этот рассказ, вы сможете понять основные концепции и терминологию, используемую в теории множеств, а также получите представление о областях, в которых эти концепции могут быть применены.

Перейдем к основам …….

Четыре основных терминологии:

Ниже приведены четыре термина, используемых при работе с набором / наборами…

  1. НАБОРЫ. Это набор элементов или вещей.
A = {1,2,3,4,5} #set of numbers
B = {apple, banana, orange} #set of fruit names

2. МОЩНОСТЬ: количество элементов / вещей, присутствующих внутри набора, в основном мощность набора представляет размер этого набора.

A = {1,2,3,4,5}   |A|=5 #cardinality of set A is 5
B = {apple, banana, orange} |B|=3 #cardinality of set B is 3

3. ПЕРЕСЕЧЕНИЕ: элементы / вещи, общие в данных наборах.

A = {1,2,3,4,5}
B = {8,3,6,5,9}
A∩B = {3,5} #intersection of set A and set B

4. СОЕДИНЕНИЕ: элементы / вещи, которые присутствуют в любом из данных наборов.

A = {1,2,3,4,5}
B = {8,3,6,5,9}
A∪B = {1,2,3,4,5,6,8,9} #union of set A and set B

В следующем разделе я проведу вас через реальный пример, который познакомит вас с некоторыми новыми терминологиями, которые вы часто будете слышать, когда будете иметь дело с любыми проблемами науки о данных или бизнеса ...

Давайте посмотрим на пример из реальной жизни:

В этом разделе давайте возьмем пример тестов на вирус короны, проводимых больницей на группе людей ...

X = {Set of people for the Corona virus test}
I = {Set of people who are infected with the virus}
S = {Set of people who are safe from the virus}
P = {Set of people who have been tested positive for the virus}
N = {Set of people who have been tested negative for the virus}

Теперь давайте рассмотрим диаграммы Венна, приведенные ниже. Здесь вы видите диаграммы Венна, которые представляют два способа разделения множества «X» на две части, т. Е.

Разделение людей, обозначенных буквой «X», на две части: люди с положительным результатом теста на вирус и люди с отрицательным результатом.

Второй способ - разделить «Х» на людей, инфицированных вирусом, и тех, кто не инфицирован.

Если мы рассуждаем логически, то у человека, инфицированного вирусом, должен быть положительный результат теста на вирус, а у безопасного человека - отрицательный, если это так, то обе диаграммы Венна должны быть идентичны, верно ??? Ответ - нет. В реальном мире дела обстоят немного иначе ...

На приведенной ниже диаграмме представлен сценарий реального мира (ПРИМЕЧАНИЕ: черный диаметр разделяет инфицированные случаи и безопасные случаи, коричневый диаметр разделяет положительные случаи и отрицательные случаи) в реальном мире возможно, что тест проводился на человеке дает неверный результат, имея это в виду, давайте рассмотрим четыре новых терминологии ...

  1. Истинные положительные результаты: люди, у которых был положительный прогноз на вирус, и прогноз верен.
  2. Ложноположительные результаты: люди, у которых был предсказан положительный результат на вирус, но этот прогноз оказался ложным.
  3. Истинные негативы: люди, у которых был предсказан отрицательный результат на вирус, и прогноз верен.
  4. Ложноотрицательные результаты: люди, которым был предсказан отрицательный результат на вирус, но этот прогноз оказался ложным.

Терминология представлена ​​в наборах как ..

I∩P = True positives
S∩P = False positives
S∩N = True negatives
I∩N = False negatives

Сравним мощности множеств…

|I∩P|÷|I| = True positive rate
|S∩P|÷|S| = False positive rate 
|S∩N|÷|S| = True negative rate 
|I∩N|÷|I| = False negative rate

Чем ближе истинно положительный и истинно отрицательный коэффициенты к 1, а ложноположительные и ложно отрицательные значения - к 0, тем выше точность прогнозируемых результатов.

Это всего лишь один из реальных примеров, где можно применить концепции наборов, есть и другие области, где наборы можно использовать для анализа данных.

Попробуйте использовать терминологию при решении реальных проблем, это поможет вам лучше понять это ... Удачи :)