Доска машинного обучения

Слабый контроль с несколькими разрешениями для последовательных данных

Доска машинного обучения (MLW) Серия с открытым исходным кодом

Наша доска машинного обучения (MLW) — это открытое пространство для мозгового штурма и обсуждения последних статей, методов и рабочих процессов в области искусственного интеллекта. Мы делаем упор на неформальную и открытую среду для всех, кто хочет больше узнать о машинном обучении.

В этом выпуске Хирому Хота, Винсент Сунн Чен, Дэниел Ю. Фу и Фредерик Сала погружаются в статью Слабое наблюдение за последовательными данными с несколькими разрешениями, автором которой является Фредерик Сала, Парома Варма. , Jason Fries, Daniel Y. Fu, Shiori Sagawa, Saelig Khattar, Ashwini Ramamoorthy, Ke Xiao, Kayvon Fatahalian, James Priest и Christopher Ré представлены на NeurIPS 2019.

Этот выпуск является частью видеоролика #MLwhiteboard, организованного Snorkel AI. Посмотрите эпизод здесь:

Абстрактный:

Поскольку ручная маркировка обучающих данных — это медленно и дорого, недавние промышленные и научные исследования обратились к более слабым или более шумным формам источников контроля. Однако существующие подходы со слабым контролем не могут моделировать источники с несколькими разрешениями для последовательных данных, таких как видео, которые могут назначать метки отдельным элементам или наборам элементов в последовательности. Ключевой проблемой при слабом надзоре является оценка неизвестной точности и корреляции этих источников без использования помеченных данных. Источники с разным разрешением усугубляют эту проблему из-за сложных корреляций и сложности выборки, которая зависит от длины последовательности. Мы предлагаем Dugong, первую платформу для моделирования слабых источников контроля с несколькими разрешениями со сложными корреляциями для присвоения вероятностных меток обучающим данным. Теоретически мы доказываем, что дюгони в мягких условиях могут уникальным образом восстанавливать ненаблюдаемые параметры точности и корреляции и использовать совместное использование параметров для повышения сложности выборки. Наш метод присваивает проверенные врачами метки биомедицинским видеорепозиториям в масштабе населения, помогая превзойти традиционную супервизию на 36,8 балла F1 и обращаясь к ключевому варианту использования, когда машинное обучение было серьезно ограничено отсутствием данных с экспертной маркировкой. В среднем Dugong улучшает традиционный контроль на 16,0 балла F1, а существующий слабый контроль приближается на 24,2 балла F1 в нескольких задачах классификации видео и датчиков.

Если вы заинтересованы в обучении вместе с нами, рассмотрите возможность присоединиться к нам на нашей двухнедельной Доске машинного обучения.

Если вы заинтересованы в том, чтобы оставаться на связи с Snorkel AI, следите за нами в Twitter, LinkedIn, Facebook, Facebook, strong>Youtube или Instagram, и если вы хотите присоединиться к команде Snorkel, мы приглашаем вас! Пожалуйста, подайте заявку на нашей странице вакансий.

Слабое наблюдение за последовательными данными с несколькими разрешениями изначально было опубликовано на сайте Snorkel AI.