Публикации по теме 'weak-supervision'


Нет ярлыков? Без проблем! Лучший способ классификации данных о банковских транзакциях
Но во-первых, почему так важна точная классификация банковских транзакций Финтех-индустрия довольно широка и призвана решить многие проблемы с помощью традиционной финансовой системы. Одной из основных проблем, с которыми сталкиваются финансовые учреждения, является возможность предоставить кредит подходящим заявителям. В Tillful задача нашей команды специалистов по обработке и анализу данных состоит в том, чтобы помочь более точно оценить кредитоспособность малого бизнеса. Мы..

Слабая сегментация сосновых позвонков на основе обучения на 3D-изображениях компьютерной томографии
Маркировка наборов данных требует больших затрат. В этом исследовании исследуются методы снижения стоимости маркировки наборов данных за счет работы с точечной аннотацией вместо полной аннотации. Я демонстрирую два новых компонента потерь и комбинацию результатов различных моделей для создания псевдомасок на основе общедоступных наборов данных. Наконец, можно получить 72 % обратно взвешенной оценки полностью аннотированной модели при примерно 12 % стоимости маркировки. Эта статья..

Astron — Слабая контролируемая система маркировки (введение)
Все начинается с вопроса… Как мы можем выделить как можно меньше человеческой силы для маркировки данных? Маркировка обучающих данных становится все более узким местом в развертывании систем машинного обучения . (Snorkel, arXiv:1711.10160 ) У нас было много данных для нашей модели НЛП, но без маркировки. Людям-аннотаторам было бы дорого и долго маркировать сотни тысяч предложений. Этот исследовательский проект — Astron решает эту проблему, используя идею маркировки функций,..

Snorkel: создание моделей машинного обучения без маркированных данных
С помощью множества практических инструментов построение моделей на основе помеченных данных уже стало простой задачей для специалистов по данным. Однако в реальном мире многие задачи не являются хорошо отформатированными задачами обучения с учителем: размеченные данные могут быть дорогими или даже невозможными. Альтернативный подход - использовать дешевые и некачественные данные для обеспечения контроля, что является темой данной статьи: слабый контроль В следующих разделах я..