Публикации по теме 'imbalanced-data'


Наука о данных: путь к более безопасным дорогам, часть II
Взгляд на дисбаланс данных под другим углом Лучший угол для решения любой проблемы - это попытка. - Анонимный Вступление Продолжение предыдущей статьи . Прежде чем идти по следу, позвольте нам очень кратко рассказать о том, что мы сделали ранее. У нас есть набор данных о столкновениях автомобилей в Сиэтле, где серьезность аварии (степень тяжести 1, 2, 3 и 4) должна быть спрогнозирована с использованием предикторов, таких как состояние дороги, тип столкновения, состояние..

Прогнозирование выживаемости при сердечной недостаточности с помощью моделей машинного обучения - Часть II
Прогнозирование выживаемости при сердечной недостаточности с помощью моделей машинного обучения - Часть II Вторая часть пошагового руководства для анализа и прогнозирования выживаемости пациентов с сердечной недостаточностью. Предисловие В предыдущем посте мы рассмотрели набор данных о сердечной недостаточности у 299 пациентов, который включал в себя несколько особенностей образа жизни и клинических проявлений. Этот пост был посвящен исследовательскому анализу данных, а этот пост..

Прогнозирование отказов APS для грузовиков Scania с помощью машинного обучения
Введение: Scania Trucks имеет систему под названием APS (система давления воздуха). Эта система создает давление воздуха, которое будет использоваться для торможения, переключения передач и т. д. Нам будут предоставлены данные, которые содержат отказы компонентов, связанных с APS, и отказы компонентов, не связанных с системами APS. Наша цель состоит в том, чтобы классифицировать данную новую точку данных как положительную или отрицательную, положительную, если данный грузовик имеет..

HireAttorney - привлечение более целенаправленного рынка для адвокатов
Определите ответчиков, которые с большей вероятностью наймут частного адвоката с помощью машинного обучения. Недавно я консультировал юридическую фирму, чтобы определить ответчиков, которые с большей вероятностью воспользуются их услугами. Раньше они пытались разослать электронные письма всем обвиняемым, но процент откликов был близок к нулю. Они также пытались определить ответчиков с высокой вероятностью найма их на основе их опыта при применении другой маркетинговой стратегии, но с..