Публикации по теме 'semi-supervised-learning'


Полуконтролируемая классификация немаркированных данных (обучение PU)
Как классифицировать немаркированные данные, когда все, что у вас есть, - это всего несколько положительных образцов Предположим, у вас есть набор данных о платежных транзакциях. Некоторые транзакции помечаются как мошеннические, а остальные - как подлинные, и вам необходимо разработать модель, которая будет различать мошеннические и подлинные транзакции. Предполагая, что у вас достаточно данных и хороших функций, это кажется простой задачей классификации. Однако предположим, что..

Snorkel: создание моделей машинного обучения без маркированных данных
С помощью множества практических инструментов построение моделей на основе помеченных данных уже стало простой задачей для специалистов по данным. Однако в реальном мире многие задачи не являются хорошо отформатированными задачами обучения с учителем: размеченные данные могут быть дорогими или даже невозможными. Альтернативный подход - использовать дешевые и некачественные данные для обеспечения контроля, что является темой данной статьи: слабый контроль В следующих разделах я..