встроенная функция ddply для нескольких столбцов

Как передать вектор/список столбцов встроенной функции plyer:ddply? Этот код работает:

newdf <-ddply(olddf, .(V1, V2), function(df)
                    c( mean(df$V3), +
                       mean(df$V4), +
                       mean(df$V5), +
                       mean(df$V6), +
                       mean(df$V7), +
                       mean(df$V8), +
                       mean(df$V9), +
                       mean(df$V10), +
                       mean(df$V11), +
                       mean(df$V12), +
                       mean(df$V13), +
                       mean(df$V14), +
                       mean(df$V15), +
                       mean(df$V16), +
                       mean(df$V17), +
                       mean(df$V18), +
                       mean(df$V19), +
                       mean(df$V20) 
                     ) 
               )

Но я хотел бы сделать что-то вроде этого (что выдает ошибку, предупреждения):

newdf <-ddply( olddf, .(V1, V2), function(df)  lapply(df[,3:20], mean) )

Error in list_to_dataframe(res, attr(.data, "split_labels"), .id, id_as_factor) : 
  Results must be all atomic, or all data frames
In addition: There were 50 or more warnings (use warnings() to see the first 50)

Спасибо за совет.


person John Williams    schedule 31.05.2014    source источник


Ответы (1)


Вы хотите sapply, а не lapply:

ddply(olddf, .(V1, V2), function(df) sapply(df[,3:20], mean) )

lapply вернет list, который, как говорит ошибка, не является атомарным, в то время как sapply попытается упростить результаты - в вашем случае в числовой вектор, тип, возвращенный вашей первой попыткой.

Но еще лучше для вашего примера colwise:

ddply(olddf, .(V1, V2), colwise(mean))
person Peyton    schedule 31.05.2014