Публикации по теме 'tidymodels'


Машинное обучение для прогнозирования наших побед в Brawlhalla — Часть вторая: прогнозный анализ (с…
Я аналитик данных, а не специалист по данным, но в последнее время я читал о теории алгоритмов машинного обучения и ее реализации в R, и мне захотелось попробовать. Затем… Я попытался построить модель машинного обучения, чтобы предсказать вероятность победы моей сестры и меня в Brawlhalla Ranked 2v2. Я не получил ожидаемых результатов и потерпел неудачу (но учусь), поэтому, если у вас есть какие-либо рекомендации для новичка по улучшению этой модели, буду признателен! Эта статья..

Как делать сложные вещи (требовательные к вычислительным ресурсам) в #Rstats
Подсказка: использование параллелизации (и, возможно, на нескольких компьютерах) Что мы делаем, когда R начинает долго «делать дело»? Во-первых, это может быть ошибка техники. Например, group_by() остается на месте, когда она не требуется (или что-то подобное, когда R выполняет избыточную, ненужную и трудоемкую обработку без нашего ведома). Однако, если ваш код полностью оптимизирован. Проблема может быть связана с тем, что R (по умолчанию) использует только одно ядро ​​ЦП вашего..

Отток клиентов банка с помощью Tidymodels — Разработка модели, часть 1
Изучение несбалансированной классификации с помощью Tidymodels Представьте, что вы специалист по данным в крупном многонациональном банке, и директор по работе с клиентами обращается к вам с просьбой разработать средство прогнозирования оттока клиентов. Вы создаете набор данных моментального снимка 10 000 клиентов с дисбалансом классов 1:4 в пользу клиентов, которые не уходят, чтобы использовать такую ​​модель бинарной классификации. Чтобы помочь в разработке модели, вы решаете..

ML трубопроводы | Аккуратные модели против Scikit Learn
Узнайте, как использовать конвейеры scikit-learn в рабочих процессах Python и Tidy Models в R Введение: Эксперимент по науке о данных или процесс построения модели представляет собой серию шагов, которые выполняются в определенной последовательности и чаще всего с несколькими итерациями. Акцент быстро смещается на отслеживание точности модели и связанных показателей, но есть много других аспектов, которые могут сделать весь процесс более структурированным, упрощая не только чтение..

Метафоры в движении: машинное обучение, иллюстрированное Tidymodels
В большом театре машинного обучения алгоритмы и модели — это больше, чем просто уравнения и вычисления — это исполнители, каждый из которых имеет свой уникальный стиль, историю и значение. Пока мы готовимся поднять занавес этой серии сказок, я предлагаю вам представить эти математические сущности как живых, дышащих персонажей, богатых нюансами и повествованием. Сила метафоры С самого начала человеческой истории мы использовали метафоры, чтобы понимать, объяснять и связываться с..

Моделирование двоичной логистической регрессии с использованием библиотеки Tidymodels в R (Часть-1)
В мире машинного обучения с учителем часто выполняются алгоритмические задачи двух типов. Один называется регрессией (прогнозирование непрерывных значений), а другой - классификацией (прогнозирование дискретных значений). В этом блоге я представил пример алгоритма двоичной классификации под названием Двоичная логистическая регрессия , который относится к семейству Биномиальное с логитом функция ссылки. Бинарная логистическая регрессия используется для прогнозирования бинарных..

Вопросы по теме 'tidymodels'

Выполнение парных взаимодействий между всеми полями с помощью рецептов
Я пытаюсь создать парные взаимодействия между каждым полем набора данных для модели glmnet без необходимости называть каждое поле по отдельности. Однако, когда он пытается выполнить это автоматически, он зацикливается на создании их для всех...
294 просмотров
schedule 23.09.2022

Прогнозирование с помощью step_naomit и сохранение идентификатора с помощью tidymodels
Я пытаюсь сохранить идентификатор в строке при прогнозировании с использованием модели случайного леса для обратного слияния с исходным фреймом данных. Я использую step_naomit в рецепте, который удаляет строки с недостающими данными, когда я запекаю...
750 просмотров
schedule 18.06.2022

fit_resamples с пакетом рейнджера не работает
попробуйте использовать перекрестную передискретизацию и подогнать случайный лес из пакета ranger. Подгонка без повторной выборки работает, но как только я пытаюсь выполнить повторную выборку, она терпит неудачу с ошибкой ниже. Рассмотрите...
571 просмотров

Как денормализовать данные с помощью tidy-моделей в r
Используя tidymodels в качестве нового рабочего процесса для разработки моделей в R, как мне денормализовать / инвертировать преобразование мощности с помощью tidymodels . dd <- data.frame(x1=1:5,x2 = 11:15,y=6:10) . Теперь используем...
131 просмотров

установить максимальную глубину для настройки рейнджера в случайном лесу tidymodels r
Я хотел бы настроить глубину своего случайного леса, чтобы избежать переобучения. Я использую tidymodels, и это код моей модели. rf_model <- rand_forest(mtry = tune(), trees = tune(), max.depth...
312 просмотров
schedule 20.04.2022

Реализация loo_cv из rsample в tidymodels
Я новичок в синтаксисе tidymodels и хотел бы реализовать перекрестную проверку без исключения, используя loo_cv из rsample в структуре tidymodel. Однако реализация кажется отличной от vfold_cv , и я не могу найти никаких полезных примеров,...
167 просмотров
schedule 31.12.2022

Параметры рецепта настройки Tidymodels
Используя tidymodels, мне очень нравится возможность настройки не только параметров модели, но и некоторых шагов рецептов. Например, количество компонентов в step_pls (). Проблема в том, что я не могу ограничить диапазон возможных значений....
324 просмотров
schedule 27.03.2024

Как смоделировать last_fit () с помощью fit () в tidymodels?
Я хотел бы применить метод случайного леса для прогнозирования времени ожидания пациентов в больнице. Я строго следую инструкциям на странице https://www.tidymodels.org/start/case-study/ , чтобы настроить мою модель. Получив свою лучшую модель, я...
587 просмотров
schedule 26.10.2022

Использование fit_xy () для cross_validation в Tidy Models
Я новичок в Tidy Models, и мне он пока нравится, но у меня есть вопрос об использовании интерфейса без формул для повторной выборки / перекрестной проверки. Как я понимаю до сих пор, чтобы применить resampling () / cross validation, я должен написать...
33 просмотров
schedule 16.01.2024

Пакет Tidymodel: общие линейные модели (glm) и дерево решений (упакованные деревья, усиленные деревья и случайный лес) модели в R
Проблема Я пытаюсь провести анализ с помощью пакета Tidymodels в R . Я следую этому руководству ниже по изучению дерева решений в R: - Учебник https://bcullen.rbind.io/post/2020-06-02-tidymodels-decision-tree-learning-in-r/ У меня есть...
144 просмотров
schedule 18.03.2023

Карта Purr для добавления результатов анализа в df
Недавно я задал очень похожий вопрос здесь - вместо этого цикла for для рандомизированной проверки гипотез r Но теперь мне нужен более простой вывод, и я изо всех сил пытаюсь настроить ранее предложенный (и очень полезный) код. So, Я наблюдал...
58 просмотров
schedule 25.05.2023

Как рабочие процессы в TidyModels применяют шаги рецепта к сгибам резюме?
Чтобы управлять положительным меньшинством в проекте, над которым я работаю, я добавляю step_downsample() в свой рецепт. Я также использую 10-кратную перекрестную проверку, чтобы уменьшить предвзятость. Когда я использую рабочий процесс для...
32 просмотров
schedule 18.05.2022

Пошаговый алгоритм в Tidymodels
Я обнаружил, что пошаговый алгоритм выбора переменных, изначально реализованный в R с step() , не интегрирован в Tidymodels. Я не знаю, есть ли причина не использовать его (из-за лучших процедур), или это просто недостаток функции.
119 просмотров
schedule 01.02.2024

как добавить собственный шаг в рецепт
Я хочу преобразовать свои функции для модели машинного обучения с помощью настраиваемого преобразования. моя функция: step_customFunc <- function(x){ 1/(max(x+1) -x)} Есть ли способ добавить это в конвейер преобразования, используя recipe и...
49 просмотров
schedule 17.10.2022

Получить AUC данных обучения из адаптированного рабочего процесса в Tidymodels?
Я борюсь с тем, как получить AUC из модели логистической регрессии с использованием tidymodels. Вот пример использования встроенного набора данных mpg . library(tidymodels) library(tidyverse) # Use mpg dataset df <- mpg # Create an...
55 просмотров
schedule 26.08.2022

Проблемы с графикой - графики частичной зависимости
Для отображения графиков частичных зависимостей создается следующая модель объяснения_tidymodels. explainer <- explain_tidymodels(rf_vi_fit, data = Data_train, y = Data_train$Lead_week) Теперь я создаю графики, делая следующее:...
35 просмотров
schedule 25.05.2023

Ошибка при попытке добавить столбец рецептов в тиббл
При попытке добавить столбец рецептов в таблицу, следуя инструкциям этого Повторите пример статьи Tidymodels, я получил следующее сообщение об ошибке: Error: Not all variables in the recipe are present in the supplied training set: 'ticker',...
38 просмотров
schedule 01.08.2022

Возникает ошибка при попытке применить рецепт tidymodels из данных поезда к передискретизации в r?
Я новичок в tidymodels и немного новичок в R . Я пытаюсь воспроизвести код Дэвида Робинсона из Youtube tidytuesday/Sliced ​​Customer churn data, но сталкиваюсь с проблемами при применении изменений рецепта к данным с перекрестной проверкой /...
43 просмотров