В мире глубокого обучения для компьютерного зрения активное обучение при эффективном использовании может значительно увеличить скорость построения моделей машинного обучения. Это также может снизить стоимость построения моделей машинного обучения.

Конвейер данных активного обучения

Конвейер данных активного обучения состоит из четырех основных частей:

  1. В первой части выполняется вывод новых обучающих данных с использованием нейронной сети (NN) версии N.
  2. Эксперты в предметной области оценивают результаты вывода, выполненного на этапе 1. На основе этой оценки крайние случаи выявляются группой экспертов в предметной области (например, радиологи в случае радиологического ИИ).
  3. Люди комментируют крайние случаи, используя инструменты маркировки.
  4. Новые обучающие данные, которые включают крайние случаи, обнаруженные на шаге 2, используются для обучения NN версии N + 1.

Источник изображения: Современное состояние искусственного интеллекта

Роль средства маркировки в выявлении крайних случаев

Процесс создания достоверных данных (маркированного набора данных) включает в себя маркировку экспертов, создающих точные метки с помощью инструмента маркировки. Помимо предоставления функций маркировки, инструменты маркировки могут играть очень важную роль в построении конвейера данных активного обучения, предоставляя дополнительные функции, такие как:

  • Разрешите профильным экспертам просмотреть результаты вывода по новым обучающим данным.
  • Позвольте экспертам в данной области определить и отметить крайние случаи, в которых произошел сбой в текущей версии нейронной сети (версия N).

Инструменты маркировки могут обеспечить эту функциональность двумя разными способами:

Вариант 1. Загрузить предварительные аннотации (маски PNG), созданные нейронной сетью версии N

Специалист по данным может загружать маски PNG, которые отображают результаты логического вывода версии N нейронной сети на новые данные.

Вариант 2: импорт нейронной сети версии N

Импортируйте нейронную сеть версии N и разрешите выполнение вывода на новых обучающих данных с помощью нейронной сети версии N.

Создайте конвейер данных активного обучения с помощью TrainingData.io

TrainingData.io имеет решение SaaS, которое позволяет профильным специалистам просматривать результаты нейронной сети двумя способами:

  1. В решении SaaS есть возможность импортировать вашу нейронную сеть и выполнять логический вывод по новым обучающим данным с использованием импортированной нейронной сети. Как только результаты вывода доступны, эксперты в предметной области могут их оценить.
  2. Решение SaaS может импортировать маски PNG, сгенерированные нейронной сетью. Это позволяет профильным экспертам оценивать результаты нейронной сети.

Хорошая платформа для аннотаций не только удовлетворяет потребности аннотаторов, но и помогает командам ИИ сотрудничать со следующими персонажами в организации:

  1. Специалисты по данным
  2. Менеджеры данных
  3. Аннотаторы (внутренние и внешние)
  4. Специалисты в предметной области (рецензенты)

TrainingData.io обеспечивает конвейер данных активного обучения для радиологии (DICOM / NIFTI) с использованием NVIDIA Clara.