Вопросы по теме 'split-apply-combine'
ddply +summary для повторения одной и той же статистической функции в большом количестве столбцов
Хорошо, второй вопрос R в быстрой последовательности.
Мои данные:
Timestamp St_01 St_02 ...
1 2008-02-08 00:00:00 26.020 25.840 ...
2 2008-02-08 00:10:00 25.985 25.790 ...
3 2008-02-08 00:20:00 25.930 25.765 ...
4 2008-02-08...
24659 просмотров
schedule
12.03.2023
Неразделенная сокращенная таблица данных на основе двух факторов в R
Предположим, у меня есть фрейм данных в R, где я хотел бы использовать 2 столбца «factor1» и «factor2» в качестве факторов, и мне нужно вычислить среднее значение для всех остальных столбцов для каждой пары вышеупомянутых факторов. После запуска...
632 просмотров
schedule
14.07.2023
Как ускорить эту функцию Rcpp?
Я хочу реализовать простую процедуру split-apply-combine в Rcpp , где набор данных (матрица) разбивается на группы, а затем возвращаются групповые суммы столбцов. Эта процедура легко реализуется в R , но часто занимает довольно много времени....
1062 просмотров
schedule
04.12.2022
Вычислить средние значения переменных в расплавленном фрейме данных, сгруппированные по имени1
У меня проблема с использованием плавления и среднего значения во фрейме данных. Возможно, это просто проблема новичка.
У меня есть фрейм данных с двумя условиями и 3 репликами
set.seed(1)
testdf <-...
2038 просмотров
schedule
01.03.2023
R перебирает уровни фактора, чтобы создать последовательность чисел для каждого уровня
Я работаю над фреймом данных с данными GPS от бобров, фрейм данных включает столбец с идентификатором животных (см. $id ниже), который является фактором с 26 уровнями. Для каждого бобра у нас есть несколько значений GPS - число отличается от...
1652 просмотров
schedule
03.05.2023
выполнение вычислений по столбцам, созданным из ddply
Я использую ddply в subset для расчета некоторых показателей и сворачивания таблицы по мере необходимости. Некоторые показатели, которые я хочу рассчитать, должны использовать сводные столбцы, созданные в результате операции ddply .
Вот...
213 просмотров
schedule
08.10.2022
Найти верхние децили из фрейма данных по группе
Я пытаюсь создать новые переменные, используя функцию и lapply , а не работать прямо в данных с помощью циклов. Раньше я использовал Stata и решил бы эту проблему с помощью метода, аналогичного обсуждаемому здесь .
Поскольку именовать переменные...
1070 просмотров
schedule
02.08.2023
Добавление агрегированных счетчиков в виде дополнительных строк данных
У меня есть фрейм данных с буквами английского алфавита и их частотой. Теперь было бы неплохо также знать частоту гласных и согласных и общее количество вхождений — и, поскольку я хочу отобразить всю эту информацию, мне нужно, чтобы она была в одном...
83 просмотров
schedule
23.06.2022
Вычислить z-оценку по двум группам
У меня есть набор данных повторных измерений, над которым я работаю. Данные выглядят так:
ID=c('X1', 'X1', 'X1', 'X1', 'X2', 'X2', 'X2', 'X3', 'X3', 'X3', 'X3', 'X4', 'X4', 'X4', 'X4', 'X5', 'X5', 'X5', 'X6', 'X6', 'X6', 'X6')
Diag=c('Con',...
657 просмотров
schedule
22.10.2022
Обработка списков списков по группам
Я хотел бы обработать список списков. В частности, я хочу извлечь кадр данных, который является третьим членом каждого списка, с помощью группирующей переменной (первый член каждого списка), а затем использовать несколько функций, таких как mean(),...
57 просмотров
schedule
03.12.2023
Разница временных меток Pandas в групповом преобразовании
У меня есть фрейм данных с целочисленным индексом, session_id, event и time_stamp, который выглядит так:
In [41]: df = pd.DataFrame(data={'session_id': np.sort(np.random.choice(np.arange(3), 11)), 'event': np.random.choice(['A', 'B', 'C', 'D'],...
622 просмотров
schedule
29.08.2022
Как использовать шаблон split-apply-combine в pandas groupby() для одновременной нормализации нескольких столбцов
Я пытаюсь нормализовать экспериментальные данные в таблице данных pandas, которая содержит несколько столбцов с числовыми наблюдаемыми (функциями), столбцы с датой и условиями эксперимента, а также дополнительные нечисловые условия, такие как имена...
6846 просмотров
schedule
30.03.2024
Pandas - прямое добавление столбцов скользящего среднего из группы по в фрейм данных
У меня есть фреймворк со следующими столбцами:
name, date, day_index, value
Я хочу добавить 4-й столбец в тот же фрейм данных, который представляет собой экспоненциально взвешенное скользящее среднее 3-го столбца (значения) для каждого имени,...
708 просмотров
schedule
25.05.2024
Панды: эффективный способ комбинировать фреймы данных
Я ищу более эффективный способ, чем pd.concat, для объединения двух фреймов данных pandas.
У меня есть большой DataFrame (размером ~ 7 ГБ) со следующими столбцами - «A», «B», «C», «D». Я хочу сгруппировать по кадру по «А», затем для каждой группы:...
169 просмотров
schedule
08.04.2023
Панды: замена определенных значений столбца в одном фрейме данных и вычисление его средневзвешенных значений
Существует следующий фрейм данных:
year
pop0
pop1
city0
city1
2019
20
40
Malibu
NYC
2018
8
60
Sydney
Dublin
2018
36
23
NYC
Malibu
2020
17
44
Malibu
NYC
2019
5
55...
33 просмотров
schedule
02.08.2022