Я новичок в R и пакете FF и пытаюсь лучше понять, как FF позволяет пользователям работать с большими наборами данных (> 4 ГБ). Я провел значительное количество времени в Интернете в поисках учебных пособий, но те, которые я мог найти, как правило, выходят за рамки моей головы.
Я лучше всего учусь на практике, поэтому в качестве упражнения я хотел бы знать, как создать набор данных длинного формата временных рядов, аналогичный встроенному в R набору данных «Indometh», используя произвольные значения. Затем я хотел бы изменить его в широкий формат. Затем я хотел бы сохранить вывод в виде файла csv.
С небольшими наборами данных это просто и может быть достигнуто с помощью следующего скрипта:
##########################################
#Generate the data frame
DF<-data.frame()
for(Subject in 1:6){
for(time in 1:11){
DF<-rbind(DF,c(Subject,time,runif(1)))
}
}
names(DF)<-c("Subject","time","conc")
##########################################
#Reshape to wide format
DF<-reshape(DF, v.names = "conc", idvar = "Subject", timevar = "time", direction = "wide")
##########################################
#Save csv file
write.csv(DF,file="DF.csv")
Но я хотел бы научиться делать это для файлов размером примерно 10 Гб. Как бы я сделал это, используя пакет FF? Заранее спасибо.