Я хочу вычислить mean
(или любую другую сводную статистику длины один, например min
, max
, length
, sum
) числовой переменной («значение») на каждом уровне группирующей переменной («группа»).
Сводная статистика должна быть назначена новой переменной, имеющей ту же длину, что и исходные данные. То есть каждая строка исходных данных должна иметь значение, соответствующее текущему значению группы - набор данных не должен не сворачиваться до одной строки для каждой группы. Например, рассмотрим группу mean
:
До
id group value
1 a 10
2 a 20
3 b 100
4 b 200
После
id group value grp.mean.values
1 a 10 15
2 a 20 15
3 b 100 150
4 b 200 150