Вопросы по теме 'plyr'

Как лучше создавать гистограммы с накоплением с несколькими переменными из ggplot2?
Мне часто приходится создавать гистограммы с накоплением для сравнения переменных, и, поскольку я делаю всю свою статистику в R, я предпочитаю делать всю свою графику в R с помощью ggplot2. Я хотел бы научиться делать две вещи: Во-первых, я хотел...
5822 просмотров
schedule 07.09.2022

Указание имен столбцов из списка в команде data.frame
У меня есть список под названием cols с названиями столбцов в нем: cols <- c('Column1','Column2','Column3') Я бы хотел воспроизвести эту команду, но с обращением к списку: data.frame(Column1=rnorm(10)) Вот что происходит, когда я...
9129 просмотров
schedule 27.11.2022

разбить кадр данных на подмножества по значениям факторов, отправить в функцию, которая возвращает класс glm, как рекомбинировать?
Благодаря функции ddply пакета plyr от Hadley мы можем взять кадр данных, разбить его на подкадры по факторам, отправить каждый в функцию, а затем объединить результаты функции для каждого подкадра данных в новый кадр данных. Но что, если функция...
3494 просмотров
schedule 10.04.2022

ddply работает в функции и смотрит в среду вне функции?
Я пытаюсь написать функцию для часто повторяющегося анализа, и одна часть этого состоит в том, чтобы подсчитать количество групп и количество членов в каждой группе, так что ddply на помощь! Однако мой код имеет проблему. ... Вот некоторые данные...
920 просмотров
schedule 10.12.2022

Как я могу переименовать выходные строки/столбцы функций **ply из plyr?
Я хотел бы указать выходные имена строк/столбцов в функции **ply , ldply , из пакета plyr. Например, У меня есть список foo , который я хочу преобразовать в data.frame и обрезать значащие цифры с помощью signif() foo <- list(var.a...
503 просмотров
schedule 12.07.2022

R: разделить несбалансированный список в столбце data.frame
Предположим, у вас есть фрейм данных со следующей структурой: df <- data.frame(a=c(1,2,3,4), b=c("job1;job2", "job1a", "job4;job5;job6", "job9;job10;job11")) где столбец b - это список, разделенный точкой с запятой (несбалансированный по...
2533 просмотров
schedule 16.07.2022

Применить список из n функций к каждой строке кадра данных?
У меня есть список функций funs <- list(fn1 = function(x) x^2, fn2 = function(x) x^3, fn3 = function(x) sin(x), fn4 = function(x) x+1) #in reality these are all f = splinefun() И у меня...
6958 просмотров
schedule 16.08.2023

Как я могу сгенерировать сводную статистику по группам, если моя группирующая переменная является фактором?
Предположим, мне нужно получить сводную статистику по набору данных mtcars (часть базовой версии R 2.12.1). Ниже я группирую автомобили по количеству цилиндров их двигателей и беру средние значения для каждой группы остальных переменных в mtcars ....
4384 просмотров
schedule 17.08.2023

R: использование ddply для применения функций к подмножествам данных
Я пытаюсь использовать метод ddply, чтобы взять фрейм данных с различной информацией о 3000 фильмах, а затем вычислить средний валовой доход для каждого жанра. Я новичок в R, и я прочитал здесь все вопросы, касающиеся ddply, но я все еще не могу...
13128 просмотров
schedule 01.06.2024

Существует ли функция R, которая применяет функцию к каждой паре столбцов?
Мне часто нужно применить функцию к каждой паре столбцов в кадре/матрице данных и вернуть результаты в матрицу. Теперь я всегда пишу цикл, чтобы сделать это. Например, чтобы создать матрицу, содержащую p-значения корреляций, я пишу: df <-...
8622 просмотров
schedule 21.06.2023

Сводная статистика с использованием ddply
Мне нравится писать функцию, используя ddply , которая выводит сводную статистику на основе имени двух столбцов data.frame mat . mat — это большой data.frame с названием столбцов "metric", "length", "species", "tree", ...,"index"...
3165 просмотров
schedule 12.03.2023

непрерывные подгруппы с ddply
Я хотел бы обобщать свои экспериментальные данные каждый раз, когда условие изменяется. Например: > df=data.frame(tos=1:9, temp=rep(c(25,50,25), each=3), response=c(3.2,3.3,3.3, 6.5, 6.5, 6.5, 3.5,3.6,3.5)) > df time temp response 1...
601 просмотров
schedule 30.03.2024

Подмножество фрейма данных с верхними n строками для каждой группы и упорядочение по переменной
Я хотел бы разделить фрейм данных на n строк, которые сгруппированы по переменной и отсортированы по убыванию по другой переменной. Это будет ясно на примере: d1 <- data.frame(Gender = c("M", "M", "F", "F", "M", "M", "F", "F"), Age =...
7308 просмотров
schedule 30.05.2022

Как plyr объединяет два столбца разных data.frames с одинаковыми именами, но разными значениями
При объединении 3 фреймов данных с использованием библиотеки plyr я встречаю некоторые значения с одним и тем же именем, но с разными значениями в разных фреймах данных. Как do.call(rbind.fill,list) решает эту задачу: по среднему...
883 просмотров
schedule 12.05.2023

Агрегировать фрейм данных по заданному столбцу и отобразить другой столбец
У меня есть фрейм данных в R следующей формы: > head(data) Group Score Info 1 1 1 a 2 1 2 b 3 1 3 c 4 2 4 d 5 2 3 e 6 2 1 f Я хотел бы агрегировать его после столбца...
117826 просмотров
schedule 12.04.2022

имена агрегированных столбцов ddply
Я использую ddply для агрегирования своих данных, но не нашел элегантного способа присвоить имена столбцов фрейму выходных данных. На данный момент я делаю это: agg_data <- ddply(raw_data, .(id, date, classification), nrow)...
3559 просмотров
schedule 18.04.2023

Ошибка объекта не найден с ddply внутри функции
Это действительно поставило под сомнение мою способность отлаживать код R. Я хочу использовать ddply() для применения одних и тех же функций к разным столбцам с последовательными именами; например. а, б, в. Для этого я намерен многократно...
14820 просмотров
schedule 13.12.2022

векторизация применения моделей mle2
Я написал модель, которую я подгоняю к данным, используя ML через пакет mle2. Однако у меня есть большой фрейм данных выборок, и я хотел бы подогнать модель к каждой реплике, а затем получить все коэффициенты модели в фрейме данных. Я безуспешно...
678 просмотров
schedule 09.10.2022

Как использовать ddply для добавления столбца во фрейм данных?
У меня есть фрейм данных, который выглядит так: site date var dil 1 A 7.4 2 2 A 6.5 2 1 A 7.3 3 2 A 7.3 3 1 B 7.1 1 2 B 7.7 2 1 B 7.7 3 2 B 7.4 3...
10241 просмотров
schedule 23.02.2022

Более быстрые способы расчета частот и перехода от длинного к широкому
Я пытаюсь получить количество каждой комбинации уровней двух переменных, «неделя» и «идентификатор». Я бы хотел, чтобы в результате были «id» в виде строк и «week» в виде столбцов, а количество - в качестве значений. Пример того, что я пробовал до...
3720 просмотров
schedule 30.08.2022