Публикации по теме 'catboost'


Amazon.com - проблема доступа сотрудников
Конкурс Kaggle Содержание Обзор ML Постановка бизнес-задачи Анализ набора данных Исследовательский анализ данных Feature Engineering | Подготовка данных Моделирование Пользовательский классификатор стекирования Развертывание модели Будущие улучшения использованная литература 1. Обзор Источник: https://www.kaggle.com/c/amazon-employee-access-challenge Это соревнование проводилось на Kaggle. Целью этого конкурса было построение модели машинного обучения,..

Оптимизация производительности CatBoost
Оптимизация производительности CatBoost Уловки для повышения эффективности обучения машинному обучению до 4 раз Повышение градиента для науки о данных Существует множество хорошо известных фреймворков повышения градиента, которые обеспечивают точность и эффективность в реальных приложениях. Они считаются многоцелевым инструментом для решения многих типов задач машинного обучения. Согласно последнему опросу Kaggle 2020 , 61,4% специалистов по данным регулярно используют..

CatBoost - новый чемпион по прогнозируемым моделям
В последние несколько лет XGBoost какое-то время был первым выбором среди конкурентов Kaggle. CatBoost в последнее время приобрел большую популярность благодаря своим превосходным характеристикам. В этом посте я расскажу о некоторых замечательных функциях CatBoost. Иллюстрация ниже основана на данных о конкуренции Kaggle Home Credit Default Risk. Риск невыполнения обязательств по программе Home Credit Можете ли вы предсказать, насколько каждый заявитель..

Работа с набором данных мобильных приложений
Вступление Моя основная работа связана с мобильной рекламой, и время от времени мне приходится работать с наборами данных мобильных приложений. Я решил сделать некоторые данные общедоступными для тех, кто хочет попрактиковаться в построении моделей или получить представление о некоторых данных, которые можно собрать из открытых источников. Я считаю, что наборы данных с открытым исходным кодом всегда полезны, поскольку они позволяют учиться и расти. Сбор данных часто бывает сложной и..