Публикации по теме 'tidyverse'


Разработка функции автоматического преобразования строк
Использование тидиверсии Недавно я построил модель машинного обучения для классификации использования зданий. В процессе переключения модели на производство формат файла данных, требующих прогнозирования, внезапно изменился. Один из параметров, который модель использует для прогнозирования, - это стоимость проекта. В новом формате данных стоимость указывается не в числовом, а в строковом виде. В некоторых случаях цены указаны в пределах диапазона, а не одного значения. Моя модель..

Отток клиентов банка с помощью Tidymodels — Разработка модели, часть 1
Изучение несбалансированной классификации с помощью Tidymodels Представьте, что вы специалист по данным в крупном многонациональном банке, и директор по работе с клиентами обращается к вам с просьбой разработать средство прогнозирования оттока клиентов. Вы создаете набор данных моментального снимка 10 000 клиентов с дисбалансом классов 1:4 в пользу клиентов, которые не уходят, чтобы использовать такую ​​модель бинарной классификации. Чтобы помочь в разработке модели, вы решаете..

Как прогнозировать продажи продукта в R Tidyverse с помощью Modeltime и Prophet
Tidyverse изменил правила игры, когда дело доходит до анализа данных в R. Экосистема Tidyverse также включает аккуратное машинное обучение, которое упрощает изучение, анализ и управление сложными объектами машинного обучения, отчасти благодаря рабочему процессу столбца списка. Я хотел попробовать прогнозирование в Tidyverse, используя пакет modeltime , разработанный Мэттом Данчо, который был создан для аккуратного прогнозирования временных рядов в соответствии с оптимизированным рабочим..

Расширенное программирование и нестандартная оценка с помощью dplyr
Расширенное программирование и нестандартное оценивание с dplyr Примерный подход к метапрограммированию в dplyr с символами и кавычками Давайте не будем слишком простыми Dplyr упрощает написание кода, связанного с данными. Однако эта простота на самом деле слишком является базовой для написания обобщенного программного кода, который может стать настоящим испытанием. К счастью, в dplyr реализовано метапрограммирование за счет использования кавычек, символов и нестандартных..

Вопросы по теме 'tidyverse'

Удалите все после последнего пробела с помощью stringr
У меня есть данные, которые выглядят так: df <- tribble( ~name, ~value, "Jake Lake MLP", 10, "Bay May CE", 5, "Drake Cake Jr. DSF", 9.1, "Sam Ram IR QQQZ", 1 ) Я хочу обрезать все имена так, чтобы они были: "Jake...
3331 просмотров
schedule 19.02.2024

Применение различных начальных параметров к модели с помощью purrr :: map в dplyr :: mutate
Пытаюсь ответить на чей-то вопрос в списке рассылки ggplot2, и я не могу его понять: https://groups.google.com/forum/#!topic/ggplot2/YgCqQX8JbPM OP хочет применить различные параметры запуска к подмножествам своих данных для модели nls. Я думал,...
815 просмотров
schedule 12.03.2022

Расширение фрейма данных с помощью tidyverse
Вот пример того, что я пытаюсь сделать: df <- data.frame( id = letters[1:5], enum_start = c(1, 1, 1, 1, 1), enum_end = c(1, 5, 3, 7, 2) ) df2 <- df %>% split(.$id) %>% lapply(function(x) cbind(x, hello = seq(x$enum_start,...
986 просмотров
schedule 11.12.2022

Рекурсивная обработка произвольных иерархий с помощью purrr
Предположим, что я хочу обрезать дерево, состоящее из иерархии вложенных списков в R, на основе определенного критерия. Я могу сделать это достаточно "легко", используя lapply : # Based an example from the NetworkD3 documentation #...
636 просмотров
schedule 23.02.2023

Как я могу заменить различные столбцы в таблице с помощью select?
Я пытаюсь заменить все столбцы, выбранные с помощью select , данными того же размера. Воспроизводимый пример: library(tidyverse) iris = as_data_frame(iris) temp = cbind( runif(nrow(iris)), runif(nrow(iris)), runif(nrow(iris)),...
860 просмотров
schedule 22.03.2022

График разброса в ggplot, одна числовая переменная в двух группах
Я хотел бы создать диаграмму рассеяния в ggplot2, которая отображает мужские test_scores по оси x и женские test_scores по оси Y, используя набор данных ниже. Я могу легко создать график geom_line, разделив мужчин и женщин и поместив дату («dts») на...
1788 просмотров
schedule 22.02.2022

R: создать фиктивные переменные на основе категориальной переменной * списков *
У меня есть фрейм данных с категориальной переменной, содержащей списки строк с переменной длиной (это важно, потому что в противном случае этот вопрос был бы дубликатом this или this ), например: df <- data.frame(x = 1:5) df$y <-...
5549 просмотров
schedule 24.04.2022

Объединение нескольких столбцов с помощью Tidyr's Unite путем ссылки на похожие имена столбцов
library(tidyr) library(dplyr) library(tidyverse) Ниже приведен код простого фрейма данных. У меня есть некоторые беспорядочные данные, которые были экспортированы с разбросанными по разным столбцам категориями факторов столбца....
1497 просмотров
schedule 13.05.2022

Что такое метод **tidyverse** для разделения df на несколько столбцов?
Я хотел бы разделить кадр данных на несколько столбцов, чтобы я мог видеть вывод summary() для каждого подмножества данных. Вот как это сделать, используя split() из base : library(tidyverse) #> Loading tidyverse: ggplot2 #>...
4321 просмотров
schedule 07.11.2022

Суммируйте столбец списка матриц в data.frame по коэффициенту группировки
У меня есть dataframe , где один из столбцов представляет собой список, содержащий матрицу для каждой строки, определяющую матрицу перехода для этого наблюдения. library(tidyverse) m <- matrix(1:4, ncol = 2) d <- data_frame(g = c('a', 'a',...
286 просмотров
schedule 10.05.2023

подсчитать количество различных переменных в группе
У меня есть кадр данных, например: df <- data.frame( ID = c('123','124','125','126'), Group = c('A', 'A', 'B', 'B'), V1 = c(1,2,1,0), V2 = c(0,0,1,0), V3 = c(1,1,0,3)) который возвращает: ID Group V1 V2 V3 1 123 A 1...
107 просмотров
schedule 29.10.2023

Сопоставьте связанные факторы с новыми столбцами в R
Используя приведенные ниже данные, я хотел бы сделать что-то обобщенное, чтобы преобразовать один столбец с факторами в отдельные связанные столбцы. Здесь столбец «буквы» создаст два новых столбца «а» и «б». data <- data.frame(letters = c("a",...
79 просмотров
schedule 27.06.2023

Таблицы результатов t-теста в R: Самый эффективный способ?
Все, Я ищу наиболее эффективный способ создания таблицы, которая сравнивает две группы по ряду переменных, суммируя результаты t-теста. Цель состоит в том, чтобы легко изменить или отредактировать количество переменных сравнения. Есть ли простой...
597 просмотров
schedule 02.06.2023

R - убрать из списка столбец Data_frame в списках аккуратно
У меня есть данные во фрейме данных, где один столбец представляет собой список. Это пример: rand_lets <- function(){ sample(letters[1:26], runif(sample(1:10, 1), min=5, max=12)) } example_data <- data.frame(ID = seq(1:5),...
1341 просмотров
schedule 27.05.2022

R - ggplot2 'уклоняется' от geom_step(), чтобы перекрыть geom_bar()
Построение подсчетов с использованием geom_bar(stat="identity") ggplot2 — эффективный метод визуализации подсчетов. Я хотел бы использовать этот метод для отображения моих наблюдаемых подсчетов и сравнения их с ожидаемыми подсчетами. Я хотел бы...
1367 просмотров
schedule 08.06.2022

Создайте длинный формат данных на основе строк последовательностей, определяемых двоеточиями и конкатенированными векторами.
У меня есть данные, в которых идентификаторы каждого наблюдения представляют собой числа, хранящиеся в виде последовательностей, обычно в виде X: Y, но иногда в виде объединенных списков. Я хотел бы привести данные в порядок, чтобы каждое наблюдение...
102 просмотров
schedule 27.10.2022

Реализация map () для столбца вложенных фреймов данных
Я обучаю себя пакету R tidyverse purr() , и у меня возникли проблемы с реализацией map() в столбце вложенных фреймов данных. Может кто-нибудь объяснить, что мне не хватает? Используя базовый набор данных R ChickWeight в качестве примера, я могу...
2521 просмотров
schedule 14.06.2023

Преобразование строки фрейма данных в имена столбцов
Есть ли быстрый способ (возможно, часть tidyverse API) превратить строку в имена столбцов для data.frame или tibble , что-то вроде tibble::column_to_rownames ? Я понимаю, что есть много способов сделать это, например. как-то неуклюже:...
2645 просмотров
schedule 22.06.2022

Группировка по нескольким программно указанным переменным в dplyr 0.6
Это с новым dplyr, который будет выпущен в ближайшее время. сценка программирования dplyr дает пример вызова group_by с переменными группировки, указанными во внешнем функция: my_summarise <- function(df, group_var) { df %>%...
447 просмотров
schedule 22.11.2023

Как определить пустой запрос в rlang?
f <- function(x) enquo(x) e <- f() #<quosure: empty> #~ Ничего из этого не работает: > is_empty(e) [1] FALSE > is_missing(e) [1] FALSE > is_false(e) [1] FALSE > is_quosure(e) [1] TRUE
664 просмотров
schedule 21.02.2023