Публикации по теме 'xgboost'


Проект машинного обучения для здоровья AI
Классификационная модель для идентификации категорий здоровья Я решил написать об этом проекте, который я недавно сделал, когда погрузился в сквозной процесс проекта машинного обучения с использованием технологий AWS, которые могут помочь некоторым новичкам. Я изучил машинное обучение, изучая микромастер статистики и науки о данных в MITx, и изучил технологии AWS ML, работая по специальности AWS ML. Объединив эти две вещи, я решил сделать проект для хакатона AWS Health AI. Первой..

Создавайте модели XGBoost / LightGBM на больших наборах данных - каковы возможные решения?
XGBoost и LightGBM зарекомендовали себя на многих наборах табличных данных как наиболее эффективные алгоритмы машинного обучения. Но когда данных очень много, как их использовать? XGBoost и LightGBM доминируют во всех недавних соревнованиях kaggle по табличным данным. Просто перейдите на любую страницу соревнований (табличные данные) и посмотрите ядра, и вы увидите. В этих соревнованиях данные не являются «огромными» - ну, не говорите мне, что данные, которые вы обрабатываете,..

XGBoost: передача бизнес-знаний с использованием монотонных ограничений
Несколько дней назад я обсуждал со своей хорошей подругой Джулией Саймон учет бизнес-знаний в модели на основе дерева решений. Она имела в виду очень простую задачу, в которой ценность для предсказания строго возрастала с заданной характеристикой. Она хотела знать, можно ли заставить модель обеспечить это ограничение. Ответ — да, и он был добавлен в XGBoost давно (примерно в декабре 2017 года, согласно журналам изменений XGBoost), но это не очень известная особенность XGBoost:..

Измерение и улучшение социального здоровья в мобильных игровых сообществах
Рэйчел Чжан, Джулиан Рунге , Эрнан Сильберман, Джеймс Марр, Кэтрин Киуреллис, Марк Уильямс, Дэн Барнс «Человек по своей природе социальное животное». Этим словам тысячи лет, и сегодня они так же верны, как и в античном мире, когда их воспринимал Аристотель. Люди от природы ориентированы на других и стремятся к социальному взаимодействию. Мы живем, работаем, едим и развлекаемся группами. Возможно, все развлечения происходят от (опосредованного) социального взаимодействия. Благодаря..

Mercedes Benz Более экологичное производство с машинным обучением.
Прогнозирование времени тестирования автомобилей с использованием модели машинного обучения В этом блоге я демонстрирую свою работу над формулировкой проблемы Mercedes-Benz Greener Manufacturing ». Начиная с первого автомобиля, Benz Patent Motor Car в 1886 году, Mercedes-Benz олицетворяет важные автомобильные инновации. К ним относятся, например, ячейка безопасности пассажира с зоной деформации, подушка безопасности и интеллектуальные вспомогательные системы. Mercedes-Benz..

Кстати, пожалуйста, поправьте меня, если я ошибаюсь, но обратите внимание, что оценка не была установлена ​​​​на «roc_auc» для XGB…
Кстати, поправьте меня, если я ошибаюсь, но обратите внимание, что в отличие от LGBM и CATBoost для подсчета очков не было установлено значение «roc_auc» для XGB, что означает, что для XGB могла использоваться «точность» по умолчанию. Это может привести к различиям в выборе модели и, следовательно, к окончательному сравнению производительности.

Когда меньше значит больше: краткий рассказ о разработке функций XGBoost
Когда меньше значит больше: краткий рассказ о разработке функций с помощью XGBoost Я сыграл второстепенную роль в запуске RAPIDS на Google Dataproc , усовершенствовав модель, которая прогнозирует стоимость проезда в такси в Нью-Йорке. Географическое расположение мест посадки и высадки пассажиров было в столбцах данных. Они записываются как измерения долготы и широты с точностью до многих десятичных знаков. Первое, что я сделал для улучшения характеристик модели, - округлил..