30. Закон Бенфорда
Это наблюдение, за которым следуют многие наборы числовых данных из реальной жизни.
В наборах данных, которые следуют закону, первые цифры скорее будут маленькими, чем большими.
Например, число 1
появляется как первая значащая цифра примерно в 30% случаев, а 9 появляется как первая значащая цифра менее чем в 5% случаев.
Закон Бенфорда применим к удивительно большому количеству наборов данных, включая:
- цены на акции
- численность населения
- уровень смертности
- физические и математические константы и т.д.
Закон Бенфорда для чисел, выраженных в базе 10, может быть математически представлен как:
где,
P(d)
= Вероятность появления первой цифры (d
)
Этот закон обычно используется для обнаружения фальшивых/случайно сгенерированных наборов данных (например, случайно сгенерированных наборов данных о населении), поскольку эти наборы данных не подчиняются закону Бенфорда.
31. Закон Ципфа
В нем говорится, что ранг-частотное распределение представляет собой обратную зависимость.
Применительно к естественному языку он утверждает, что частота любого слова обратно пропорциональна его рангу в таблице частот.
Например, самое часто встречающееся слово будет встречаться примерно в два раза чаще, чем второе по частоте слово, и в три раза чаще, чем третье по частоте слово.
n
наиболее часто встречающееся слово будет встречаться с вероятностью, пропорциональной1/n
.
Точно так же закон верен для других наборов данных, таких как:
- математические выражения
- ранги нот в музыке
- рейтинг доходов
- ранги количества людей, смотрящих один и тот же телеканал
Отличное видео, описывающее закон Ципфа, можно найти ниже:
32. Принцип Парето
Этот принцип гласит, что для многих реальных результатов примерно 80%
последствий исходят из 20%
причин.
Наблюдения, следующие принципу Парето, могут быть представлены распределениями Парето.
«Распределение Парето — Википедия
Распределение Парето, названное в честь итальянского инженера-строителя, экономиста и социолога Вильфредо Парето (…en.wikipedia.org)
Удивительно, но принцип Парето верен и в информатике.
Microsoft отметила, что исправление 20 % ошибок, о которых чаще всего сообщают, позволит устранить 80 % связанных с ними ошибок и сбоев в данной системе.
33. Закон Прайса
В нем говорится, что 50% любого заданного результата генерируется квадратным корнем из числа тех, кто в нем участвует.
Например, 50 % всех публикаций по заданной тематике публикуются с учетом квадратного корня всех авторов.
Или, в компании со 100 работниками, 10 будут производить 50% всей продукции.
Ознакомьтесь с другими частями этой серии ниже:
Спасибо, что прочитали эту статью!
Если вы новичок в Python или программировании в целом, ознакомьтесь с моей новой книгой под названиемThe No Bulls**t Guide To Learning Pythonниже: