30. Закон Бенфорда

Это наблюдение, за которым следуют многие наборы числовых данных из реальной жизни.

В наборах данных, которые следуют закону, первые цифры скорее будут маленькими, чем большими.

Например, число 1 появляется как первая значащая цифра примерно в 30% случаев, а 9 появляется как первая значащая цифра менее чем в 5% случаев.

Закон Бенфорда применим к удивительно большому количеству наборов данных, включая:

  • цены на акции
  • численность населения
  • уровень смертности
  • физические и математические константы и т.д.

Закон Бенфорда для чисел, выраженных в базе 10, может быть математически представлен как:

где,

  • P(d) = Вероятность появления первой цифры (d)

Этот закон обычно используется для обнаружения фальшивых/случайно сгенерированных наборов данных (например, случайно сгенерированных наборов данных о населении), поскольку эти наборы данных не подчиняются закону Бенфорда.

31. Закон Ципфа

В нем говорится, что ранг-частотное распределение представляет собой обратную зависимость.

Применительно к естественному языку он утверждает, что частота любого слова обратно пропорциональна его рангу в таблице частот.

Например, самое часто встречающееся слово будет встречаться примерно в два раза чаще, чем второе по частоте слово, и в три раза чаще, чем третье по частоте слово.

n наиболее часто встречающееся слово будет встречаться с вероятностью, пропорциональной 1/n.

Точно так же закон верен для других наборов данных, таких как:

  • математические выражения
  • ранги нот в музыке
  • рейтинг доходов
  • ранги количества людей, смотрящих один и тот же телеканал

Отличное видео, описывающее закон Ципфа, можно найти ниже:

32. Принцип Парето

Этот принцип гласит, что для многих реальных результатов примерно 80% последствий исходят из 20% причин.

Наблюдения, следующие принципу Парето, могут быть представлены распределениями Парето.



«Распределение Парето — Википедия
Распределение Парето, названное в честь итальянского инженера-строителя, экономиста и социолога Вильфредо Парето (…en.wikipedia.org)



Удивительно, но принцип Парето верен и в информатике.

Microsoft отметила, что исправление 20 % ошибок, о которых чаще всего сообщают, позволит устранить 80 % связанных с ними ошибок и сбоев в данной системе.

33. Закон Прайса

В нем говорится, что 50% любого заданного результата генерируется квадратным корнем из числа тех, кто в нем участвует.

Например, 50 % всех публикаций по заданной тематике публикуются с учетом квадратного корня всех авторов.

Или, в компании со 100 работниками, 10 будут производить 50% всей продукции.

Ознакомьтесь с другими частями этой серии ниже:



















Спасибо, что прочитали эту статью!

Если вы новичок в Python или программировании в целом, ознакомьтесь с моей новой книгой под названиемThe No Bulls**t Guide To Learning Pythonниже: