У меня есть датасет, сделанный в формате корзины данных. Я прочитал этот набор данных в R, используя вызов пакета arules. который имеет встроенную функцию для чтения транзакций, поэтому я использовал ее и прочитал свой набор данных. Ниже приведен код, который я использовал:
trans = read.transactions("C:/Users/HARI/Desktop/Graph_mining/transactional_data_v3.csv", format = "basket", sep=",",rm.duplicates=TRUE)
inspect(trans[1:5])
items
1 {,
ANTIVERT,
SOFTCLIX}
2 {,
CEFADROXIL,
ESTROGEN}
3 {,
BENZAMYCIN,
BETAMETH,
KEFLEX,
PERCOCET}
4 {,
ACCUTANE(RXPAK;10X10),
BENZAMYCIN}
5 {,
ALBUTEROL,
BUTISOLSODIUM,
CLARITIN,
NASACORTAQ}
Как видите, когда я использую inspect(trans)
, он показывает транзакции с пустым столбцом в каждой. Мой вопрос: как я могу удалить эти пустые столбцы?
Полный dput
объекта trans
можно найти по этой ссылке.
dput(trans)
- person IRTFM   schedule 24.03.2015"14834", "14835", "14836"), class = "AsIs")), .Names = "itemsetID", row.names = c(NA, -14836L), class = "data.frame") )
Вот что я получаю послеdput(trans)
- person Harish   schedule 24.03.2015dput(head(trans, 20))
для 20 первых строк - person Dominic Comtois   schedule 24.03.2015trans@itemInfo
? Вероятно, у вас есть пустой элемент. - person Neal Fultz   schedule 24.03.2015trans@itemInfo
, у него есть список из 3778 элементов. - person Harish   schedule 24.03.2015structure(list(...
, не знаю, почему в данном случае это не так. И он выдает ошибки (в нем есть '...' и другие нарушения. Можете ли вы попробовать только с 5 строками? (dput(head(trans))
) - person Dominic Comtois   schedule 24.03.2015dput
он показывает 3778 строк и 6 столбцов после того, как я импортирую файл с помощью функцииread.transaction
из пакета arules. - person Harish   schedule 24.03.2015