-›Априорный алгоритм — это основная теория, используемая в правилах логических ассоциаций.

-›Это новаторский алгоритм, который анализирует метод майнинга по уровням.

-›Это новаторский алгоритм, предложенный для частого извлечения наборов элементов.

-›Априорный алгоритм — это итеративный метод, использующий горизонтальный подход к форматированию данных.

-›Свойство априорного алгоритма состоит в следующем:

Свойство закрытия вниз

Свойство частых шаблонов, используемых в интеллектуальном анализе данных, — это свойство замыкания вниз, которое гласит:

Подмножество в любом наборе частых элементов должно быть частым.

Например, если надмножество {арахисовое масло, хлеб, джем} встречается часто, то подмножество {хлеб, джем} также должно быть частым.

То есть каждая транзакция (в магазине), имеющая {арахисовое масло, хлеб, джем}, также должна содержать {хлеб, джем}.

  • Алгоритм Apriori использует двухэтапный метод генерации и тестирования стратегии, который обычно называют объединением и сокращением.

Принцип априорной обрезки:

Надмножество набора элементов, которое оказалось нечастым, не должно создаваться.

  • Алгоритм Apriori генерирует одиночные элементы, пары и триплеты путем объединения элементов в транзакциях.
  • Алгоритм Apriori использует генерацию кандидатов, которая представляет собой шаг соединения, выполняемый путем объединения наборов элементов двух транзакций.

Методика выполнения априорного алгоритма:

  • Сбор данных: Соберите транзакции или наборы элементов для выполнения априорного алгоритма.
  • Сокращение: исключите наборы элементов, которые, кажется, не повторяются в транзакциях.
  • Присоединяйтесь: сгенерируйте K (случайное число по вашему вкусу) наборов-кандидатов.
  • Протестируйте наборы элементов-кандидатов: проверьте, является ли частота набора элементов выше или ниже уровня поддержки. Если он выше уровня поддержки, набор элементов остается для повторения на следующем шаге соединения. Если частота ниже уровня поддержки, набор элементов переходит на этап сокращения и удаляется.
  • Частые наборы элементов: мы получаем частые наборы элементов из оставшихся наборов элементов, соответствующих уровню поддержки.
  • Завершить: когда невозможно создать наборы кандидатов или наборы часто используемых элементов, алгоритмы следует остановить.

Давайте закрепим эту концепцию с помощью диаграммы:

Преимущества априорного алгоритма:

  • Полученные знания из алгоритма интуитивно понятны и просты для понимания.
  • Реализация алгоритма с учетом огромных наборов данных, состоящих из нескольких наборов элементов, проще в реализации.
  • Теоретически и проблематично.

Недостатки априорного алгоритма:

  • Этот метод плохо работает с крошечными наборами данных, и вполне вероятно, что будут созданы ошибочные корреляции.
  • Требуется полное сканирование для проверки поддержки набора данных.
  • С увеличением количества наборов элементов время выполнения растет экспоненциально.
  • Каждый набор кандидатов должен храниться в памяти, поэтому память тратится впустую.
  • Если набор данных большой, а уровень поддержки низкий, априорный подход требует значительных вычислительных затрат.

Чтобы преодолеть многочисленные недостатки, мы должны использовать различные стратегии, такие как

Варианты, включающие хэширование и транзакции, могут повысить эффективность алгоритма.

С другой стороны, выборка и разделение уменьшают количество сканирований данных до двух или одного.

Эти варианты априорного алгоритма обсуждаются в следующей статье.