Вопросы по теме 'split-apply-combine'

ddply +summary для повторения одной и той же статистической функции в большом количестве столбцов
Хорошо, второй вопрос R в быстрой последовательности. Мои данные: Timestamp St_01 St_02 ... 1 2008-02-08 00:00:00 26.020 25.840 ... 2 2008-02-08 00:10:00 25.985 25.790 ... 3 2008-02-08 00:20:00 25.930 25.765 ... 4 2008-02-08...
24659 просмотров

Неразделенная сокращенная таблица данных на основе двух факторов в R
Предположим, у меня есть фрейм данных в R, где я хотел бы использовать 2 столбца «factor1» и «factor2» в качестве факторов, и мне нужно вычислить среднее значение для всех остальных столбцов для каждой пары вышеупомянутых факторов. После запуска...
632 просмотров

Как ускорить эту функцию Rcpp?
Я хочу реализовать простую процедуру split-apply-combine в Rcpp , где набор данных (матрица) разбивается на группы, а затем возвращаются групповые суммы столбцов. Эта процедура легко реализуется в R , но часто занимает довольно много времени....
1062 просмотров
schedule 04.12.2022

Вычислить средние значения переменных в расплавленном фрейме данных, сгруппированные по имени1
У меня проблема с использованием плавления и среднего значения во фрейме данных. Возможно, это просто проблема новичка. У меня есть фрейм данных с двумя условиями и 3 репликами set.seed(1) testdf <-...
2038 просмотров
schedule 01.03.2023

R перебирает уровни фактора, чтобы создать последовательность чисел для каждого уровня
Я работаю над фреймом данных с данными GPS от бобров, фрейм данных включает столбец с идентификатором животных (см. $id ниже), который является фактором с 26 уровнями. Для каждого бобра у нас есть несколько значений GPS - число отличается от...
1652 просмотров
schedule 03.05.2023

выполнение вычислений по столбцам, созданным из ddply
Я использую ddply в subset для расчета некоторых показателей и сворачивания таблицы по мере необходимости. Некоторые показатели, которые я хочу рассчитать, должны использовать сводные столбцы, созданные в результате операции ddply . Вот...
213 просмотров
schedule 08.10.2022

Найти верхние децили из фрейма данных по группе
Я пытаюсь создать новые переменные, используя функцию и lapply , а не работать прямо в данных с помощью циклов. Раньше я использовал Stata и решил бы эту проблему с помощью метода, аналогичного обсуждаемому здесь . Поскольку именовать переменные...
1070 просмотров

Добавление агрегированных счетчиков в виде дополнительных строк данных
У меня есть фрейм данных с буквами английского алфавита и их частотой. Теперь было бы неплохо также знать частоту гласных и согласных и общее количество вхождений — и, поскольку я хочу отобразить всю эту информацию, мне нужно, чтобы она была в одном...
83 просмотров

Вычислить z-оценку по двум группам
У меня есть набор данных повторных измерений, над которым я работаю. Данные выглядят так: ID=c('X1', 'X1', 'X1', 'X1', 'X2', 'X2', 'X2', 'X3', 'X3', 'X3', 'X3', 'X4', 'X4', 'X4', 'X4', 'X5', 'X5', 'X5', 'X6', 'X6', 'X6', 'X6') Diag=c('Con',...
657 просмотров
schedule 22.10.2022

Обработка списков списков по группам
Я хотел бы обработать список списков. В частности, я хочу извлечь кадр данных, который является третьим членом каждого списка, с помощью группирующей переменной (первый член каждого списка), а затем использовать несколько функций, таких как mean(),...
57 просмотров
schedule 03.12.2023

Разница временных меток Pandas в групповом преобразовании
У меня есть фрейм данных с целочисленным индексом, session_id, event и time_stamp, который выглядит так: In [41]: df = pd.DataFrame(data={'session_id': np.sort(np.random.choice(np.arange(3), 11)), 'event': np.random.choice(['A', 'B', 'C', 'D'],...
622 просмотров

Как использовать шаблон split-apply-combine в pandas groupby() для одновременной нормализации нескольких столбцов
Я пытаюсь нормализовать экспериментальные данные в таблице данных pandas, которая содержит несколько столбцов с числовыми наблюдаемыми (функциями), столбцы с датой и условиями эксперимента, а также дополнительные нечисловые условия, такие как имена...
6846 просмотров

Pandas - прямое добавление столбцов скользящего среднего из группы по в фрейм данных
У меня есть фреймворк со следующими столбцами: name, date, day_index, value Я хочу добавить 4-й столбец в тот же фрейм данных, который представляет собой экспоненциально взвешенное скользящее среднее 3-го столбца (значения) для каждого имени,...
708 просмотров

Панды: эффективный способ комбинировать фреймы данных
Я ищу более эффективный способ, чем pd.concat, для объединения двух фреймов данных pandas. У меня есть большой DataFrame (размером ~ 7 ГБ) со следующими столбцами - «A», «B», «C», «D». Я хочу сгруппировать по кадру по «А», затем для каждой группы:...
169 просмотров

Панды: замена определенных значений столбца в одном фрейме данных и вычисление его средневзвешенных значений
Существует следующий фрейм данных: year pop0 pop1 city0 city1 2019 20 40 Malibu NYC 2018 8 60 Sydney Dublin 2018 36 23 NYC Malibu 2020 17 44 Malibu NYC 2019 5 55...
33 просмотров