ddply работает в функции и смотрит в среду вне функции?

Я пытаюсь написать функцию для часто повторяющегося анализа, и одна часть этого состоит в том, чтобы подсчитать количество групп и количество членов в каждой группе, так что ddply на помощь! Однако мой код имеет проблему. ...

Вот некоторые данные для примера

> dput(BGBottles)
structure(list(Machine = structure(c(1L, 1L, 1L, 2L, 2L, 2L, 
3L, 3L, 3L, 4L, 4L, 4L), .Label = c("1", "2", "3", "4"), class = "factor"), 
    weight = c(14.23, 14.96, 14.85, 16.46, 16.74, 15.94, 14.98, 
    14.88, 14.87, 15.94, 16.07, 14.91)), .Names = c("Machine", 
"weight"), row.names = c(NA, -12L), class = "data.frame")

и вот мой код

foo<-function(exp1, exp2, data) {
 datadesc<-ddply(data, .(with(data, get(exp2))), nrow)
 return(datadesc)
}

Если я запускаю эту функцию, я получаю сообщение об ошибке

> foo(exp="Machine",exp1="weight",data=BGBottles)
Error in eval(substitute(expr), data, enclos = parent.frame()) : 
  invalid 'envir' argument

Однако, если я сначала определяю свои переменные exp1, exp2 и данных в глобальной среде, это работает

> exp1<-"weight"
> exp2<-"Machine"
> data<-BGBottles
> foo(exp="Machine",exp1="weight",data=BGBottles)
  with.data..get.exp2.. V1
1                     1  3
2                     2  3
3                     3  3
4                     4  3

Итак, я предполагаю, что ddply работает вне среды функции? Есть ли способ остановить это, или я делаю что-то не так?

Спасибо

Павел.


person PaulHurleyuk    schedule 30.06.2010    source источник


Ответы (2)


Это пример этой ошибки: http://github.com/hadley/plyr/issues#issue/3. Но, как указывает Марек, вам все равно не нужно сюда добираться.

person hadley    schedule 30.06.2010

Вам не нужно get:

foo<-function(exp1, exp2, data) {
    datadesc<-ddply(data, exp2, nrow)
    return(datadesc)
}
person Marek    schedule 30.06.2010