Я пытаюсь написать функцию для часто повторяющегося анализа, и одна часть этого состоит в том, чтобы подсчитать количество групп и количество членов в каждой группе, так что ddply на помощь! Однако мой код имеет проблему. ...
Вот некоторые данные для примера
> dput(BGBottles)
structure(list(Machine = structure(c(1L, 1L, 1L, 2L, 2L, 2L,
3L, 3L, 3L, 4L, 4L, 4L), .Label = c("1", "2", "3", "4"), class = "factor"),
weight = c(14.23, 14.96, 14.85, 16.46, 16.74, 15.94, 14.98,
14.88, 14.87, 15.94, 16.07, 14.91)), .Names = c("Machine",
"weight"), row.names = c(NA, -12L), class = "data.frame")
и вот мой код
foo<-function(exp1, exp2, data) {
datadesc<-ddply(data, .(with(data, get(exp2))), nrow)
return(datadesc)
}
Если я запускаю эту функцию, я получаю сообщение об ошибке
> foo(exp="Machine",exp1="weight",data=BGBottles)
Error in eval(substitute(expr), data, enclos = parent.frame()) :
invalid 'envir' argument
Однако, если я сначала определяю свои переменные exp1, exp2 и данных в глобальной среде, это работает
> exp1<-"weight"
> exp2<-"Machine"
> data<-BGBottles
> foo(exp="Machine",exp1="weight",data=BGBottles)
with.data..get.exp2.. V1
1 1 3
2 2 3
3 3 3
4 4 3
Итак, я предполагаю, что ddply работает вне среды функции? Есть ли способ остановить это, или я делаю что-то не так?
Спасибо
Павел.