Интеллектуальный анализ данных cSPADE в R с использованием arulesSequences — ошибка при преобразовании в формат транзакций

У меня возникли проблемы с преобразованием моих данных в формат, совместимый с cSPADE.

Мой фрейм данных выглядит так:

 key type1 type2 type3 
 A-1  A     B     C
 B-2  P     Q    NA
 C-3  X     NA   NA

Когда я использую dataset1<- as(dataset, "transactions") и запускаю-

rules<- cspade(dataset1, parameter = list(support = 0.4), control = list(verbose = TRUE))

Выдает ошибку - Error in cspade(dataset1, parameter = list(support = 0.4), control = list(verbose = TRUE)) : slot transactionInfo: missing 'sequenceID' or 'eventID'

Может ли кто-нибудь помочь, как преобразовать вышеуказанный набор данных в формат, совместимый с cSPADE?


person Akshay Huria    schedule 10.12.2014    source источник


Ответы (1)


попробуй с этим:

исходный набор данных в этом формате:

1 3 A B C
2 2 P Q    
3 1 X

первый столбец для идентификатора последовательности, второй столбец для длины последовательности, а затем элементы последовательностей. Затем:

data <- read_baskets(con = "./input_file.txt", info = c("sequenceID","eventID","SIZE"))
rules<- cspade(data, parameter = list(support = 0.4), control = list(verbose = TRUE))

дайте мне знать, если это работает.

Это мой вывод:

parameter specification:
support : 0.4
maxsize :  10
maxlen  :  10

algorithmic control:
bfstype  : FALSE
verbose  :  TRUE
summary  : FALSE
tidLists : FALSE

preprocessing ... 1 partition(s), 0 MB [0.1s]
mining transactions ... 0 MB [0.06s]
reading sequences ... [0s]

total elapsed time: 0.16s

 > inspect(rules)
items   support 
1 <{B}> 0.3333333 
2 <{C}> 0.3333333 
3 <{Q}> 0.3333333 
4 <{B,   
 C}> 0.3333333
person ntrax    schedule 10.12.2014