Вопросы по теме 'tidyr'

условное разбиение строки в R (с использованием tyr)
У меня есть такой фрейм данных: X <- data.frame(value = c(1,2,3,4), variable = c("cost", "cost", "reed_cost", "reed_cost")) Я хотел бы разделить столбец переменных на два; один столбец, чтобы указать, является ли...
2513 просмотров
schedule 24.05.2022

Удаление неполных случаев из вывода tidyr - gather () - r
У меня есть неопрятные данные в фрейме данных, который выглядит так. Здесь вы можете увидеть в «команде» названия некоторых футбольных команд. Name1-3 - это переменная, в которой перечислены различные имена, используемые для обозначения этих...
4034 просмотров
schedule 27.06.2022

Соберите несколько наборов столбцов
У меня есть данные онлайн-опроса, в котором респонденты задают цикл вопросов 1-3 раза. Программное обеспечение опроса (Qualtrics) записывает эти данные в несколько столбцов, то есть в Q3.2 опроса будут столбцы Q3.2.1. , Q3.2.2. и Q3.2.3. : df...
106199 просмотров
schedule 09.09.2022

Правильная идиома для добавления строк с нулевым счетчиком в tidyr / dplyr
Предположим, у меня есть некоторые данные подсчета, которые выглядят так: library(tidyr) library(dplyr) X.raw <- data.frame( x = as.factor(c("A", "A", "A", "B", "B", "B")), y = as.factor(c("i", "ii", "ii", "i", "i", "i")), z =...
15905 просмотров
schedule 05.03.2022

как spread () в tidyr обрабатывает уровни факторов
Я манипулировал своими данными и обнаружил, что в какой-то момент сделал что-то не так. Когда я изучил проблему, проблема свелась к следующему поведению spread() в пакете tidyr . Вот наглядный пример. Допустим, у нас есть следующий фрейм...
28894 просмотров
schedule 03.08.2023

R: пакет DPLYR: ошибка bind_rows при вызове пользовательской функции
Используя DPLYR и TIDYR, я пытаюсь создать аккуратную версию набора данных, в которой строки могут отсутствовать в зависимости от данных определенных столбцов. Я создал функцию, которая возвращает отсутствующие строки (путем создания их с данными по...
1094 просмотров
schedule 10.06.2022

R: от широкого списка тегов к длинному списку соединений
У меня есть фрейм данных с индивидуальными настройками для тегов, обозначенных 1 или 0: mydata <- data.frame( ID = c(1:4), tag1 = c(1, 0, 1, 0), tag2 = c(0, 0, 0, 0), tag3 = c(1, 0, 1, 1), tag4 = c(1, 1, 0, 1), tag5 =...
76 просмотров
schedule 09.05.2023

тидир от широкой до длинной с двумя повторными измерениями
У меня есть некорректные данные. Он имеет две вложенные повторяющиеся меры (Q1 / Q2, вложенные в Constructs). Я бы хотел переместить его из широкого формата в длинный. ## id time Q1..Ask Q2..Ask Q1..Tell Q2..Tell Q1..Respond Q2..Respond ## 1...
632 просмотров
schedule 21.04.2022

Сложное изменение формы данных в R
У меня есть фрейм данных с 3 столбцами (выдержка ниже): df <- data.frame( id = c(1,1,1,2,2,2), Year = c(2007, 2008, 2009, 2007, 2008, 2009), A = c(5, 2, 3, 7, 5, 6), B = c(10, 0, 50, 13, 17, 17) ) df Я хотел бы иметь это:...
421 просмотров
schedule 15.03.2023

Использование оконных функций dplyr для вычисления процентилей
У меня есть рабочее решение, но я ищу более чистое и удобочитаемое решение, которое, возможно, использует преимущества некоторых из новых оконных функций dplyr. Используя набор данных mtcars, если я хочу посмотреть на 25-й, 50-й, 75-й процентили, а...
61148 просмотров
schedule 11.12.2021

Преобразование имени столбца в имя переменной
У меня есть два фрейма данных (df1 и df2). один фрейм данных имеет только один столбец с 1000 строками, а второй фрейм данных имеет 1000 столбцов. Я хочу сделать содержимое строки столбца 1 df1 именем var для df2. Имена по умолчанию есть для df1 /...
65 просмотров
schedule 25.07.2023

Использование Tidyr / Dplyr для суммирования количества групп строк
Мне нужно суммировать количество строк, которые я назначаю группам, и я знаю, что могу сделать это в dplyr / tidyr, но мне чего-то не хватает. Пример набора данных: Owner = c('bob','julia','cheryl','bob','julia','cheryl') Day = c('Mon', 'Tue')...
2317 просмотров
schedule 11.01.2023

Легко изменять порядок уровней факторов после уборки или плавления
Я пытаюсь эффективно построить серию двумерных графиков. Каждый график должен показывать частоту случаев ряда демографических переменных, распределенных по полу. Этот код прекрасно работает, но при создании упорядоченной переменной variable ее...
1054 просмотров
schedule 13.04.2022

изменить форму и агрегировать данные
Я задал очень похожий вопрос, и, поскольку я не совсем разобрался с тидыром или изменением формы, я должен задать другой вопрос. У меня есть таблица данных, содержащая повторяющиеся значения идентификатора (см. ниже): id Product NI 1 Direct...
104 просмотров
schedule 25.02.2023

Как контролировать имена новых переменных после распространения тайдыра?
У меня есть кадр данных со структурой панели: 2 наблюдения для каждой единицы за два года: library(tidyr) mydf <- data.frame( id = rep(1:3, rep(2,3)), year = rep(c(2012, 2013), 3), value = runif(6) ) mydf # id year value...
12930 просмотров
schedule 05.06.2022

Сведение строк и столбцов, но с условием для столбца PASSFAIL в R
У меня есть такой фрейм данных NUM <- c(1,2,3,1,2,3,1,2,3,1) ID <- c("DJ45","DJ45","DJ45","DJ46","DJ46","DJ46","DJ47","DJ47","DJ47","DJ48") Type <- c("A", "F", "C", "B", "D", "A", "E", "C", "F", "D") Points1 <-...
60 просмотров
schedule 16.07.2022

Как разделить столбец на два в R, используя отдельный
У меня есть набор данных с таким столбцом местоположений (41.797634883, -87.708426986). Я пытаюсь разделить его на широту и долготу. Пробовал использовать отдельный метод из пакета tidyr library(dplyr) library(tidyr) df <- data.frame(x =...
31618 просмотров
schedule 25.05.2024

R: Объединение одинаковых строк в одну (желательно с помощью dplyr/tidyr)
У меня проблема, которую я не могу понять У меня есть такой фрейм данных df <- data.frame(c(rep_len("a",3), "b", "b"), c(rep_len(55, 3), 44, 44),c(rep_len(12, 3), 6, 6), c("na", 2, "na", 3, "na"), c("na", "na", 4, "na", 8), c(5, "na", "na",...
1179 просмотров
schedule 17.02.2023

Как использовать tidyr для заполнения заполненных строк в каждом значении группирующей переменной?
Скажем, у меня есть данные о людях, которые выбирают один из нескольких вариантов. У меня есть одна строка на человека, и я хочу иметь одну строку на человека и вариант выбора. Итак, если у меня есть 10 человек, у которых есть 3 варианта, прямо...
9842 просмотров
schedule 09.02.2024

Как сделать данные в одном столбце (длинном) с несколькими вложенными групповыми категориями широкими
У меня куча данных, и я пытаюсь эффективно привести их в форму. Вот упрощенный короткий образец общего формата моего data.frame прямо сейчас. Основное отличие состоит в том, что у меня есть еще несколько меток данных, таких как Label1 , для моих...
156 просмотров
schedule 23.05.2023