По сути, у меня есть большой фрейм данных: 10 000 000x900 (строки, столбцы), и я пытаюсь параллельно преобразовать класс каждого столбца. Конечным результатом должен быть data.frame
Вот что у меня есть:
Представьте, что df
- это уже определенный фрейм данных, все столбцы представляют собой смесь числовых и символьных классов.
library(snow)
cl=makeCluster(50,type="SOCK")
cl.out=clusterApplyLB(cl,df,function(x)factor(x,exclude=NULL))
cl.out
- это список того, что я хочу, за исключением того, что мне нужно, чтобы это было как класс data.frame
Итак, вот где я застрял... я пытаюсь объединить все элементы cl.out в data.frame, который не будет параллельным? (МЕДЛЕННО, время - проблема)
Могу ли я реализовать что-то еще с другим пакетом? (для каждого?)
Должен ли я жестко кодировать некоторые c, чтобы сделать это эффективно?
Любая помощь будет оценена по достоинству.
Спасибо,