Публикации по теме 'tidyverse'
Разработка функции автоматического преобразования строк
Использование тидиверсии
Недавно я построил модель машинного обучения для классификации использования зданий. В процессе переключения модели на производство формат файла данных, требующих прогнозирования, внезапно изменился. Один из параметров, который модель использует для прогнозирования, - это стоимость проекта. В новом формате данных стоимость указывается не в числовом, а в строковом виде. В некоторых случаях цены указаны в пределах диапазона, а не одного значения. Моя модель..
Отток клиентов банка с помощью Tidymodels — Разработка модели, часть 1
Изучение несбалансированной классификации с помощью Tidymodels
Представьте, что вы специалист по данным в крупном многонациональном банке, и директор по работе с клиентами обращается к вам с просьбой разработать средство прогнозирования оттока клиентов. Вы создаете набор данных моментального снимка 10 000 клиентов с дисбалансом классов 1:4 в пользу клиентов, которые не уходят, чтобы использовать такую модель бинарной классификации. Чтобы помочь в разработке модели, вы решаете..
Как прогнозировать продажи продукта в R Tidyverse с помощью Modeltime и Prophet
Tidyverse изменил правила игры, когда дело доходит до анализа данных в R. Экосистема Tidyverse также включает аккуратное машинное обучение, которое упрощает изучение, анализ и управление сложными объектами машинного обучения, отчасти благодаря рабочему процессу столбца списка. Я хотел попробовать прогнозирование в Tidyverse, используя пакет modeltime , разработанный Мэттом Данчо, который был создан для аккуратного прогнозирования временных рядов в соответствии с оптимизированным рабочим..
Расширенное программирование и нестандартная оценка с помощью dplyr
Расширенное программирование и нестандартное оценивание с dplyr
Примерный подход к метапрограммированию в dplyr с символами и кавычками
Давайте не будем слишком простыми
Dplyr упрощает написание кода, связанного с данными. Однако эта простота на самом деле слишком является базовой для написания обобщенного программного кода, который может стать настоящим испытанием. К счастью, в dplyr реализовано метапрограммирование за счет использования кавычек, символов и нестандартных..
Вопросы по теме 'tidyverse'
Удалите все после последнего пробела с помощью stringr
У меня есть данные, которые выглядят так:
df <- tribble(
~name, ~value,
"Jake Lake MLP", 10,
"Bay May CE", 5,
"Drake Cake Jr. DSF", 9.1,
"Sam Ram IR QQQZ", 1
)
Я хочу обрезать все имена так, чтобы они были:
"Jake...
3331 просмотров
schedule
19.02.2024
Применение различных начальных параметров к модели с помощью purrr :: map в dplyr :: mutate
Пытаюсь ответить на чей-то вопрос в списке рассылки ggplot2, и я не могу его понять: https://groups.google.com/forum/#!topic/ggplot2/YgCqQX8JbPM
OP хочет применить различные параметры запуска к подмножествам своих данных для модели nls. Я думал,...
815 просмотров
schedule
12.03.2022
Расширение фрейма данных с помощью tidyverse
Вот пример того, что я пытаюсь сделать:
df <- data.frame(
id = letters[1:5],
enum_start = c(1, 1, 1, 1, 1),
enum_end = c(1, 5, 3, 7, 2)
)
df2 <- df %>%
split(.$id) %>%
lapply(function(x) cbind(x, hello = seq(x$enum_start,...
986 просмотров
schedule
11.12.2022
Рекурсивная обработка произвольных иерархий с помощью purrr
Предположим, что я хочу обрезать дерево, состоящее из иерархии вложенных списков в R, на основе определенного критерия. Я могу сделать это достаточно "легко", используя lapply :
# Based an example from the NetworkD3 documentation
#...
636 просмотров
schedule
23.02.2023
Как я могу заменить различные столбцы в таблице с помощью select?
Я пытаюсь заменить все столбцы, выбранные с помощью select , данными того же размера. Воспроизводимый пример:
library(tidyverse)
iris = as_data_frame(iris)
temp = cbind( runif(nrow(iris)), runif(nrow(iris)), runif(nrow(iris)),...
860 просмотров
schedule
22.03.2022
График разброса в ggplot, одна числовая переменная в двух группах
Я хотел бы создать диаграмму рассеяния в ggplot2, которая отображает мужские test_scores по оси x и женские test_scores по оси Y, используя набор данных ниже. Я могу легко создать график geom_line, разделив мужчин и женщин и поместив дату («dts») на...
1788 просмотров
schedule
22.02.2022
R: создать фиктивные переменные на основе категориальной переменной * списков *
У меня есть фрейм данных с категориальной переменной, содержащей списки строк с переменной длиной (это важно, потому что в противном случае этот вопрос был бы дубликатом this или this ), например:
df <- data.frame(x = 1:5)
df$y <-...
5549 просмотров
schedule
24.04.2022
Объединение нескольких столбцов с помощью Tidyr's Unite путем ссылки на похожие имена столбцов
library(tidyr)
library(dplyr)
library(tidyverse)
Ниже приведен код простого фрейма данных. У меня есть некоторые беспорядочные данные, которые были экспортированы с разбросанными по разным столбцам категориями факторов столбца....
1497 просмотров
schedule
13.05.2022
Что такое метод **tidyverse** для разделения df на несколько столбцов?
Я хотел бы разделить кадр данных на несколько столбцов, чтобы я мог видеть вывод summary() для каждого подмножества данных.
Вот как это сделать, используя split() из base :
library(tidyverse)
#> Loading tidyverse: ggplot2
#>...
4321 просмотров
schedule
07.11.2022
Суммируйте столбец списка матриц в data.frame по коэффициенту группировки
У меня есть dataframe , где один из столбцов представляет собой список, содержащий матрицу для каждой строки, определяющую матрицу перехода для этого наблюдения.
library(tidyverse)
m <- matrix(1:4, ncol = 2)
d <- data_frame(g = c('a', 'a',...
286 просмотров
schedule
10.05.2023
подсчитать количество различных переменных в группе
У меня есть кадр данных, например:
df <- data.frame(
ID = c('123','124','125','126'),
Group = c('A', 'A', 'B', 'B'),
V1 = c(1,2,1,0),
V2 = c(0,0,1,0),
V3 = c(1,1,0,3))
который возвращает:
ID Group V1 V2 V3
1 123 A 1...
107 просмотров
schedule
29.10.2023
Сопоставьте связанные факторы с новыми столбцами в R
Используя приведенные ниже данные, я хотел бы сделать что-то обобщенное, чтобы преобразовать один столбец с факторами в отдельные связанные столбцы. Здесь столбец «буквы» создаст два новых столбца «а» и «б».
data <- data.frame(letters = c("a",...
79 просмотров
schedule
27.06.2023
Таблицы результатов t-теста в R: Самый эффективный способ?
Все,
Я ищу наиболее эффективный способ создания таблицы, которая сравнивает две группы по ряду переменных, суммируя результаты t-теста. Цель состоит в том, чтобы легко изменить или отредактировать количество переменных сравнения. Есть ли простой...
597 просмотров
schedule
02.06.2023
R - убрать из списка столбец Data_frame в списках аккуратно
У меня есть данные во фрейме данных, где один столбец представляет собой список. Это пример:
rand_lets <- function(){
sample(letters[1:26], runif(sample(1:10, 1), min=5, max=12))
}
example_data <- data.frame(ID = seq(1:5),...
1341 просмотров
schedule
27.05.2022
R - ggplot2 'уклоняется' от geom_step(), чтобы перекрыть geom_bar()
Построение подсчетов с использованием geom_bar(stat="identity") ggplot2 — эффективный метод визуализации подсчетов. Я хотел бы использовать этот метод для отображения моих наблюдаемых подсчетов и сравнения их с ожидаемыми подсчетами. Я хотел бы...
1367 просмотров
schedule
08.06.2022
Создайте длинный формат данных на основе строк последовательностей, определяемых двоеточиями и конкатенированными векторами.
У меня есть данные, в которых идентификаторы каждого наблюдения представляют собой числа, хранящиеся в виде последовательностей, обычно в виде X: Y, но иногда в виде объединенных списков. Я хотел бы привести данные в порядок, чтобы каждое наблюдение...
102 просмотров
schedule
27.10.2022
Реализация map () для столбца вложенных фреймов данных
Я обучаю себя пакету R tidyverse purr() , и у меня возникли проблемы с реализацией map() в столбце вложенных фреймов данных. Может кто-нибудь объяснить, что мне не хватает?
Используя базовый набор данных R ChickWeight в качестве примера, я могу...
2521 просмотров
schedule
14.06.2023
Преобразование строки фрейма данных в имена столбцов
Есть ли быстрый способ (возможно, часть tidyverse API) превратить строку в имена столбцов для data.frame или tibble , что-то вроде tibble::column_to_rownames ?
Я понимаю, что есть много способов сделать это, например. как-то неуклюже:...
2645 просмотров
schedule
22.06.2022
Группировка по нескольким программно указанным переменным в dplyr 0.6
Это с новым dplyr, который будет выпущен в ближайшее время.
сценка программирования dplyr дает пример вызова group_by с переменными группировки, указанными во внешнем функция:
my_summarise <- function(df, group_var) {
df %>%...
447 просмотров
schedule
22.11.2023
Как определить пустой запрос в rlang?
f <- function(x) enquo(x)
e <- f()
#<quosure: empty>
#~
Ничего из этого не работает:
> is_empty(e)
[1] FALSE
> is_missing(e)
[1] FALSE
> is_false(e)
[1] FALSE
> is_quosure(e)
[1] TRUE
664 просмотров
schedule
21.02.2023