Публикации по тегам split-apply-combine

Вопросы по теме 'split-apply-combine'

ddply +summary для повторения одной и той же статистической функции в большом количестве столбцов

Хорошо, второй вопрос R в быстрой последовательности. Мои данные: Timestamp St_01 St_02 ... 1 2008-02-08 00:00:00 26.020 25.840 ... 2 2008-02-08 00:10:00 25.985 25.790 ... 3 2008-02-08 00:20:00 25.930 25.765 ... 4 2008-02-08...

24659 просмотров

12.03.2023

Неразделенная сокращенная таблица данных на основе двух факторов в R

Предположим, у меня есть фрейм данных в R, где я хотел бы использовать 2 столбца «factor1» и «factor2» в качестве факторов, и мне нужно вычислить среднее значение для всех остальных столбцов для каждой пары вышеупомянутых факторов. После запуска...

632 просмотров

r dataframe split lapply split-apply-combine

14.07.2023

Как ускорить эту функцию Rcpp?

Я хочу реализовать простую процедуру split-apply-combine в Rcpp , где набор данных (матрица) разбивается на группы, а затем возвращаются групповые суммы столбцов. Эта процедура легко реализуется в R , но часто занимает довольно много времени....

1062 просмотров

r c++ performance rcpp split-apply-combine

04.12.2022

Вычислить средние значения переменных в расплавленном фрейме данных, сгруппированные по имени1

У меня проблема с использованием плавления и среднего значения во фрейме данных. Возможно, это просто проблема новичка. У меня есть фрейм данных с двумя условиями и 3 репликами set.seed(1) testdf <-...

2038 просмотров

r mean dataframe melt split-apply-combine

01.03.2023

R перебирает уровни фактора, чтобы создать последовательность чисел для каждого уровня

Я работаю над фреймом данных с данными GPS от бобров, фрейм данных включает столбец с идентификатором животных (см. $id ниже), который является фактором с 26 уровнями. Для каждого бобра у нас есть несколько значений GPS - число отличается от...

1652 просмотров

r gps split-apply-combine

03.05.2023

выполнение вычислений по столбцам, созданным из ddply

Я использую ddply в subset для расчета некоторых показателей и сворачивания таблицы по мере необходимости. Некоторые показатели, которые я хочу рассчитать, должны использовать сводные столбцы, созданные в результате операции ddply . Вот...

213 просмотров

r dataframe plyr split-apply-combine

08.10.2022

Найти верхние децили из фрейма данных по группе

Я пытаюсь создать новые переменные, используя функцию и lapply , а не работать прямо в данных с помощью циклов. Раньше я использовал Stata и решил бы эту проблему с помощью метода, аналогичного обсуждаемому здесь . Поскольку именовать переменные...

1070 просмотров

r dataframe rank quantile split-apply-combine

02.08.2023

Добавление агрегированных счетчиков в виде дополнительных строк данных

У меня есть фрейм данных с буквами английского алфавита и их частотой. Теперь было бы неплохо также знать частоту гласных и согласных и общее количество вхождений — и, поскольку я хочу отобразить всю эту информацию, мне нужно, чтобы она была в одном...

83 просмотров

r dataframe aggregate rbind split-apply-combine

23.06.2022

Вычислить z-оценку по двум группам

У меня есть набор данных повторных измерений, над которым я работаю. Данные выглядят так: ID=c('X1', 'X1', 'X1', 'X1', 'X2', 'X2', 'X2', 'X3', 'X3', 'X3', 'X3', 'X4', 'X4', 'X4', 'X4', 'X5', 'X5', 'X5', 'X6', 'X6', 'X6', 'X6') Diag=c('Con',...

657 просмотров

r aggregate split-apply-combine

22.10.2022

Обработка списков списков по группам

Я хотел бы обработать список списков. В частности, я хочу извлечь кадр данных, который является третьим членом каждого списка, с помощью группирующей переменной (первый член каждого списка), а затем использовать несколько функций, таких как mean(),...

57 просмотров

r plyr tapply split-apply-combine

03.12.2023

Разница временных меток Pandas в групповом преобразовании

У меня есть фрейм данных с целочисленным индексом, session_id, event и time_stamp, который выглядит так: In [41]: df = pd.DataFrame(data={'session_id': np.sort(np.random.choice(np.arange(3), 11)), 'event': np.random.choice(['A', 'B', 'C', 'D'],...

622 просмотров

python pandas numpy timestamp split-apply-combine

29.08.2022

Как использовать шаблон split-apply-combine в pandas groupby() для одновременной нормализации нескольких столбцов

Я пытаюсь нормализовать экспериментальные данные в таблице данных pandas, которая содержит несколько столбцов с числовыми наблюдаемыми (функциями), столбцы с датой и условиями эксперимента, а также дополнительные нечисловые условия, такие как имена...

6846 просмотров

python pandas normalization split-apply-combine

30.03.2024

Pandas - прямое добавление столбцов скользящего среднего из группы по в фрейм данных

У меня есть фреймворк со следующими столбцами: name, date, day_index, value Я хочу добавить 4-й столбец в тот же фрейм данных, который представляет собой экспоненциально взвешенное скользящее среднее 3-го столбца (значения) для каждого имени,...

708 просмотров

python pandas pandas-groupby moving-average split-apply-combine

25.05.2024

Панды: эффективный способ комбинировать фреймы данных

Я ищу более эффективный способ, чем pd.concat, для объединения двух фреймов данных pandas. У меня есть большой DataFrame (размером ~ 7 ГБ) со следующими столбцами - «A», «B», «C», «D». Я хочу сгруппировать по кадру по «А», затем для каждой группы:...

169 просмотров

python pandas performance split-apply-combine

08.04.2023

Панды: замена определенных значений столбца в одном фрейме данных и вычисление его средневзвешенных значений

Существует следующий фрейм данных: year pop0 pop1 city0 city1 2019 20 40 Malibu NYC 2018 8 60 Sydney Dublin 2018 36 23 NYC Malibu 2020 17 44 Malibu NYC 2019 5 55...

33 просмотров

python pandas dataframe sorting split-apply-combine

02.08.2022