Публикации по теме 'classification'


Прогнозирование сбоев при запуске с помощью классификации
Прогнозирование сбоев при запуске с помощью классификации [Этот проект был выполнен как часть иммерсивной программы обработки данных под названием Metis. Вы можете найти файлы этого проекта на моем GitHub , а слайды - здесь . Окончательная модель доступна здесь ] Немного предыстории Недавно я протестировал множество алгоритмов классификации, чтобы узнать, могу ли я предсказать, выйдет ли запуск из строя, используя набор данных CrunchBase . Обычно кому-то нужна учетная..

Представляем Classificationbox: легко создавайте собственный классификатор машинного обучения текста / изображений / данных…
Мы только что выпустили Classificationbox в качестве предварительной версии для разработчиков. Classificationbox - это универсальная утилита классификации машинного обучения, разработанная и построенная для масштабирования. Classificationbox позволяет использовать машинное обучение для автоматической классификации различных типов данных, таких как текст, изображения, структурированные и неструктурированные данные. Имея относительно небольшой набор обучающих данных, вы можете..

🔥Поджог или поджог? Классификация твитов о стихийных бедствиях, часть первая: исследование данных
Обработка естественного языка (NLP) в различных формах существует уже несколько десятилетий, но в последние годы наблюдается огромный рост благодаря программным библиотекам, которые упрощают анализ и машинное обучение свободного текста. Недавний конкурс Kaggle по классификации твитов между теми, кто обсуждает настоящую чрезвычайную ситуацию, и теми, которые не обсуждаются, на первый взгляд кажется простым, но ставит сложные задачи даже перед людьми, привыкшими работать с текстом и..

Распознавание рукописных цифр с использованием логистической регрессии
Логистическая регрессия - это алгоритм контролируемого обучения для решения проблем классификации, таких как отнесение электронной почты к категории спама или не спама. Это может быть использовано для распознавания рукописных цифр от 0 до 9. Данное изображение рукописной цифры принадлежит одной из десяти цифр (от 0 до 9). Это называется классификацией «один против всех». Давайте использовать в качестве данных подмножество рукописных цифровых изображений MNIST. Есть 10 ярлыков /..

Использование пользовательской метрики в Catboost: классификация как регрессия
В этом блоге я поделюсь своим опытом определения пользовательской метрики в Catboost для соревнования Kaggle. Страница документации Catboost предоставляет пример того, как реализовать настраиваемую метрику для детектора переобучения и выбора лучшей модели. Хотя я не счел это достаточно тривиальным, поэтому пишу это как справочник для себя и других пользователей, которым эти заметки могут оказаться полезными. Во-первых, я расскажу, почему я хочу использовать настраиваемую метрику,..

Индекс стандарта классификации загрязнения воздуха
Введение Загрязнение воздуха – это присутствие в атмосфере одного или нескольких физических, химических или биологических веществ в количествах, которые могут нанести вред здоровью людей, животных и растений, нарушить эстетику и комфорт или нанести ущерб имуществу. Загрязнение воздуха может быть вызвано природными источниками, а также деятельностью человека. Некоторые определения физической неприятности, такие как шумовое загрязнение, тепловое, радиационное или световое загрязнение,..

Прогнозирование смертности - подход к несбалансированной классификации с использованием CatBoost Classifier
Вы когда-нибудь задумывались, как возможна классификация следующих событий с помощью инструментов машинного обучения, если между происходящими событиями существует серьезный дисбаланс и асимметрия: Банки распознают ошибочные и прерванные транзакции, где большинство транзакций приходится на законный конец, и очень мало процессов могут быть обнаружены как дефектные. Компания проверяет свои произведенные товары на предмет повреждения продукции, где маловероятно, что фирма произведет..