Эта статья впервые появилась на https://deepmirror.ai/2021-12-09-spark-instance-segmentation/ — автор Макс Джейкобс

Почти все биомедицинские анализы изображений начинаются с получения нескольких изображений, будь то клиническое испытание, в ходе которого МРТ-сканы получают от пациентов, или лаборатория, испытывающая новые методы лечения культивируемых клеток. Чтобы извлечь клиническую и научную информацию из этих изображений, исследователи и клиницисты могут воспользоваться последними достижениями в области искусственного интеллекта (ИИ), например, для автоматического определения определенных областей интереса на этих изображениях или для автоматической классификации изображений по нескольким категориям. Хотя эти задачи могут быть надежно выполнены экспертами-людьми, это требует много времени и денег. ИИ может помочь, но его нужно тренировать с помощью гигантских наборов данных, тщательно отобранных вручную. Управляемая человеком обработка данных (также называемая аннотацией) часто занимает месяцы или годы и создает барьер для применения ИИ для решения новых задач.

Но что, если бы можно было уменьшить количество аннотаций, необходимых для обучения ИИ? Сократив количество аннотаций, исследователи и клиницисты смогут в кратчайшие сроки запустить ИИ для новых приложений, что ускорит прорывы в биомедицинском секторе. Это имело бы огромное практическое применение, поскольку количество необработанных данных часто огромно, а количество проверенных данных — нет. В DeepMirror мы решили решить эту проблему, рассматривая то, как люди учатся. Например, чтобы научиться распознавать кошек, людям не нужен гигантский набор аннотированных изображений кошек. Часто бывает достаточно нескольких изображений, и, сопоставляя их с другими изображениями, человек может точно определить местонахождение кошек поблизости. Мы задались вопросом, сможем ли мы воспроизвести это с помощью метода искусственного интеллекта, который называется обучение с частичным наблюдением. При полу-контролируемом обучении ИИ обучается на нескольких известных и проверенных данных, таких как, например, несколько изображений с аннотациями кошек и большой набор данных неаннотированных примеров. После почти двух лет итерации алгоритмов полууправляемого обучения мы создали современную структуру, которая ориентирована на применимость в реальном мире, т. Е. Легко настраивается для любых задач ИИ.

Познакомьтесь с DeepMirror Spark, полууправляемой платформой обучения ИИ, которая использует специализированные дополнения данных (т. е. искажает данные, чтобы они «выглядели» как новые данные), состязательное обучение (используя два конкурирующих ИИ с целью повышения производительности ИИ) и другие методы. для обучения ИИ на небольших наборах данных!

Наши первые клиенты часто сталкивались с трудностями при сегментации экземпляров, которая представляет собой точное обнаружение форм отдельных объектов на изображениях. Сегментация экземпляров может, например, использоваться для определения размера рака на рентгенологических изображениях и обилия биомаркеров на гистопатологических изображениях. Чтобы протестировать и оценить нашу платформу DeepMirror Spark, мы применили ее к настраиваемой архитектуре сегментации биомедицинских экземпляров на основе популярной UNet (Рисунок 1).

Эффективность обучения ИИ

Одна только эта реализация DeepMirror Spark на основе UNet может использоваться для множества различных задач анализа изображений. Например, на рисунках 2 и 3 мы обучили сеть UNet обнаруживать островки Лангерганса на изображениях поджелудочной железы человека, используя всего 46 аннотированных изображений, и опухоли головного мозга на МРТ-сканах, используя всего 75 изображений. В обоих случаях традиционное (т. е. полуконтролируемое) обучение приводило к снижению эффективности обучения и ухудшению сегментации.

Исследования абляции на данных изображений радиологии и клеточной биологии

Чтобы проверить производительность DeepMirror Spark в зависимости от аннотированных изображений, мы провели исследования абляции, т. е. мы взяли несколько общедоступных и созданных внутри наборов данных изображений и варьировали количество помеченных изображений. В ходе этого эксперимента мы смогли количественно оценить преимущества DeepMirror Spark по сравнению с обычным обучением для небольших наборов данных (Рисунок 4–6).

Мы заметили, что DeepMirror Spark позволил нам достичь максимальной средней точности (AP) всего с 20–300 изображениями в зависимости от сложности данных. При обычном обучении той же сети не удалось достичь одинаковых показателей AP с любым количеством изображений из небольшого набора данных, что означает, что с помощью DeepMirror Spark можно создавать функциональный ИИ намного быстрее.

Что дальше

Сейчас мы работаем над расширением платформы DeepMirror Spark для выполнения других задач, помимо сегментации экземпляров. В ближайшие несколько недель мы добавим классификацию изображений, семантическую сегментацию и многое другое. Кроме того, мы работаем над интеграцией других типов данных, таких как геномные последовательности и молекулярные структуры, для экспериментов по редактированию генов и открытию лекарств! Следите за дальнейшими сообщениями в блогах по этим темам 🙂

Если вы хотите как можно быстрее добавить ИИ в свои проекты, свяжитесь с нами по адресу [email protected], чтобы провести пилотное исследование вашего набора данных!