Априорный алгоритм — это алгоритм ассоциации или рекомендации, который помогает нам связывать объекты внутри набора данных, создавая из него правила. Он в основном используется в рекомендациях фильмов, рекомендациях по покупкам в Интернете и т. Д.

Как мы видим, априорная функция принимает транзакции, min_support, min_confidence, min_lift и min_length в качестве своих аргументов, поэтому мы обсудим их один за другим, насколько они важны.

min_support для данного элемента равен (частоте данного элемента в каждой транзакции/ общему количеству транзакций). Элементы, которые появятся в наших правилах, должны иметь более высокую поддержку, чем min_support.

min_confidence — это мера правильности наших правил, которые мы создаем.

min_lift – отличный показатель для измерения силы правила .

min_length – это минимальное число. элементов, с которыми мы будем создавать правила

Работа априорного алгоритма: -

Чтобы понять работу алгоритма Apriori, мы будем использовать следующую таблицу транзакций с различными элементами.

Мы будем рассматривать минимальную поддержку = 50 % и минимальную достоверность = 50 %, и, таким образом, числовое значение минимальной поддержки для наших транзакций будет = (данное значение %/100)*(количество транзакций) = (50/100)*4 = 2 >

Теперь мы создадим серию таблиц-кандидатов (C1, C2…), чтобы проверить частоту каждого элемента в таблице транзакций.

Таким образом, таблица C1: →

Поскольку числовое значение минимальной поддержки = 2, мы будем извлекать только те, частота которых больше или равна 2 в таблице L1.

Теперь мы создадим группу из 2 элементов из таблицы L1 и рассчитаем их частоту в таблице C2.

Мы снова повторим тот же шаг, чтобы создать таблицу L2, где частота больше или равна 2.

Так как у нас больше нет комбинаций больше или равных 2, то мы создадим наши правила, используя следующие пункты таблицы L2.

Поскольку у нас здесь только 2 элемента, хлеб и масло, мы можем создать только 2 правила, т.е. хлеб → масло и масло → хлеб, но если у нас больше 2 элементов, т.е. strong>p,q,r,s, то мы можем создать такие правила, как p^q^r → s , p^q → r^s и т. д.…

Чтобы вычислить достоверность, например. p → q , необходимо использовать support/(вхождение p) .

Поскольку минимальная достоверность указана как 50%, поэтому мы должны выбрать только те правила, которые больше или равны 50% достоверности. Здесь оба правила имеют достоверность выше 50%, поэтому оба они будут рассмотрены.

Таким образом, мы можем заключить, что если кто-то покупает там хлеб, то с вероятностью 66 % он может купить и масло, тогда как если кто-то покупает масло, то с вероятностью 100 % он также будет хлебать . Так работает алгоритм APRIORI. Дайте мне знать, если у кого-то есть вопросы, комментарии или проблемы в разделе комментариев, а пока наслаждайтесь обучением.