Публикации по теме 'xgboost'


Моделирование цены с помощью регулярной линейной модели и Xgboost
Моделирование цены с помощью регулярной линейной модели и Xgboost Разработка статистических моделей для прогнозирования цен на индивидуальное жилье Мы хотели бы смоделировать цену дома, мы знаем, что цена зависит от местоположения дома, площади дома, года постройки, года ремонта, количества спален, количества гаражей и т. Д. Таким образом, эти факторы влияют на в соответствии с шаблоном - выгодное расположение обычно ведет к более высокой цене. Однако все дома в пределах одной..

Мультиклассовая классификация с набором данных диапазона цен для мобильных устройств
Источник данных Мобильная ценовая классификация: https://www.kaggle.com/iabhishekofficial/mobile-price-classification Автор: Абхишек Шарма Резюме проекта Имея более 20 функций, связанных с различными характеристиками мобильных телефонов, моя цель — найти лучший алгоритм, который поможет принимать ценовые решения для «воображаемого менеджера Боба». К вашему сведению, Боб — выдуманный человек, HA. Трубопроводный анализ Исследовательский анализ данных Нормализация..

Ускоритель XGBosst: gbtree v.s. дротик против gblinear
gbtree Booster использует версию дерева регрессии в качестве слабого обучаемого gblinear использует (обобщенную) линейную регрессию со сжатием l1 и l2. Но поскольку это аддитивный процесс и поскольку линейная регрессия сама по себе является аддитивной моделью, сохраняются только коэффициенты комбинированной линейной модели. dart перенял метод исключения из нейронных сетей в пользу ускоренной регрессии. Необходимо настроить несколько параметров: skip_drop (по умолчанию =..

Прогноз кассовых сборов TMDB
В этом блоге я покажу вам, как я решил задачу регрессии. В этом задании нам предоставляются метаданные о более чем 7000 прошлых фильмов из базы данных фильмов, чтобы попытаться спрогнозировать их общий мировой кассовый доход. Цели: Предсказать их общий мировой кассовый доход. Минимизируйте разницу между прогнозируемым и фактическим доходом (RMSE). Исследование данных Фильмы отмечены id . Точки данных включают актерский состав, съемочную группу, ключевые слова сюжета, бюджет,..

Рекомендации по ценообразованию Airbnb на Филиппинах
[Этот проект был выполнен в рамках 12-недельной стипендиальной программы по науке о данных в Eskwelabs . Вы можете найти файлы этого проекта на моем GitHub , а слайды - здесь . Окончательный проект доступен здесь (интерактивное веб-приложение). Живую презентацию можно посмотреть здесь .] В прошлом году, как и большинство других предприятий, Airbnb был потрясен COVID-19. Несколько новостей о будущем Airbnb озаглавили несколько статей, поскольку большое количество отмен и..

Графические процессоры NVIDIA и Apache Spark, на шаг ближе
Пакет RAPIDS XGBoost4J-Spark уже доступен Авторы: Энди Фенг, Томас Грейвс, Роберт Эванс, Джейсон Лоу, Гэри Шен Хотя RAPIDS начинался с фокусировки на Python API, многие хотят ощутить такое же ускорение NVIDIA GPU в Apache Spark ; на самом деле, у нас их много в NVIDIA. Когда RAPIDS впервые был запущен, у нас был план по ускорению Apache Spark , а также Dask , и мы хотим поделиться некоторыми основными достижениями, которых мы добились за последние пару месяцев. Apache Spark..

Машинное обучение для обнаружения мошенничества с использованием классификатора XGBoost
Введение Представьте себе, что вы стоите у кассы в супермаркете, позади вас длинная очередь, а кассир не очень тихо объявляет, что ваша карта отклонена. В данный момент вы, вероятно, не думаете о науке о данных, которая определила вашу судьбу. Хотя вы уверены, что у вас есть средства, чтобы покрыть все, карта все равно не примет платеж. После этого вы отходите в сторону и позволяете кассиру обслуживать другого покупателя, а вам приходит уведомление или сообщение от банка, что..