априорный алгоритм занимает время в r

Я имею дело с набором данных, имеющим 614 переменных и 1348 транзакций, и пытаюсь запустить его в R, но время обработки слишком велико, поэтому код никогда не показывает окончательный результат, и мой ноутбук зависает.

a <- read.csv("v.csv")
library(arules)
for(i in 1:ncol(a))
    a[i]<-  as.factor(a[,i])
rules <- apriori(a,parameter=list(supp = .5 , conf = 0.9, target="rules"))
summary(g)

Пожалуйста, скажите мне, где я ошибаюсь.


person tuhin    schedule 20.11.2015    source источник
comment
Сначала попробуйте небольшое подмножество, а затем развивайте его. Я подозреваю, что вы не сможете многое сделать, поскольку у вас есть 2 точки данных для каждого параметра.   -  person Roman Luštrik    schedule 20.11.2015
comment
Он работал с небольшими наборами данных. Но также и во встроенном наборе данных для взрослых, имеющем 2127 obs и 4 vbls.. Не могу понять, почему он здесь не работает..   -  person tuhin    schedule 21.11.2015
comment
Встроенный набор данных для взрослых проходит предварительную обработку и гарантирует, что преобразование в двоичные элементы в транзакциях работает. Сделайте следующее: as(a, transaction). Он должен сказать вам, сколько элементов создано...   -  person Michael Hahsler    schedule 01.01.2016


Ответы (1)


Я думаю, что ваша проблема может быть связана с данными. Я думаю, что некоторые из ваших переменных в a могут быть непрерывными переменными, а as.factor создаст значение фактора для каждого из уникальных значений. Затем apriori попытается преобразовать значение каждого фактора в отдельный элемент, создав чрезвычайно большую матрицу, из-за которой ваш ноутбук зависнет.

Примечание. Это чистое предположение, поскольку я не знаю, как выглядят ваши данные.

person Michael Hahsler    schedule 21.11.2015