Медицинская визуализация, такая как компьютерная томография (КТ), магнитно-резонансная томография (МРТ), позитронно-эмиссионная томография (ПЭТ), маммография, ультразвук и рентген, приобрела все большее значение в последние десятилетия. Обнаружение, диагностика и лечение заболеваний имеют решающее значение в ранней медицине. Специалисты-люди в первую очередь несут ответственность за интерпретацию медицинских изображений в клиниках (например, радиологи и врачи).

Однако из-за резких изменений в патологии и потенциальной усталости экспертов-людей исследователи и клиницисты только недавно начали получать пользу от компьютерных вмешательств. Прогресс в вычислительном анализе медицинских изображений отстает по сравнению с технологией медицинской визуализации. , он стал набирать обороты с помощью методов машинного обучения.

Заболевания с высокой частотой встречаемости, такие как опухоли головного мозга, болезнь Альцгеймера, неврологическая дегенерация и церебральная аневризма, или некоторые очень распространенные виды рака, такие как простата, грудь и т. д., вызвали интерес исследователей машинного обучения во всем мире. Машинное обучение, скорее всего, изменит то, как мы наблюдаем закономерности в данных и как их можно использовать для лечения здоровья мозга в течение следующего десятилетия. В этой статье рассматриваются некоторые реальные приложения этой зарождающейся революции.

Машинное обучение и глубокое обучение в анализе медицинских изображений

Модели машинного обучения (МО) и глубокого обучения (ГО) набирают популярность в биомедицинских исследованиях и клинической практике, демонстрируя потенциал в различных приложениях, таких как моделирование и стратификация рисков, персонализированный скрининг, диагностика, предсказание ответа на терапию и прогнозирование.

Путем интеграции данных из различных источников, включая медицинскую визуализацию, факторы риска заболевания, мультиомные данные, терапевтические процедуры и данные последующего наблюдения, эти достижения могут оказать значительное клиническое влияние, что приведет к высокоэффективным медицинским услугам и конвергенция человеческого интеллекта и машинного обучения.

Традиционные подходы

Традиционные исследования в области машинного обучения для классификации изображений в основном используют предварительно обученные модели глубокого обучения (DL), такие как ResNet (остаточная сеть) и VGGNet (группа визуальной геометрии).

ResNet — это тип сверточной нейронной сети, используемый для классификации изображений. Это вариант предыдущей модели DL без ворот или с открытыми воротами. Остаточные соединения позволяют ResNet изучать и распространять информацию гораздо глубже, чем предыдущие нейронные сети. Архитектура VGG состоит из блоков, где каждый блок состоит из слоев 2D Convolution и Max Pooling, поскольку они позволяют глубоко обучать модель с возможностью двух- или трехслойного метода.

Классический ML выполняет несколько шагов, таких как

Принимая во внимание, что DL может следовать двумя разными путями, которые являются более точными и короткими, чем классические пути ML.

Альтернативный подход

Мы также можем построить решение, используя модель EfficientNet.

EfficientNet — это семейство моделей классификации изображений, разработанных Google Research. Как следует из названия, EfficientNet предназначена дляповышения точности и эффективности как с точки зрения вычислительных ресурсов, так и использования памяти с помощью AutoML и методов масштабирования модели.

В этом подходе в качестве базовой модели используется EfficientNet, а поверх него добавляется плотный слой с активацией «ReLu».

ReLu, выпрямленная линейная единица, широко используемая в нейронных сетях, устраняет отрицательные значения. По сути, это линейная функция, которая работает как однополупериодный выпрямитель (преобразовывая полупериод входного переменного тока в выходной постоянный ток) в электротехнике.

Наконец, выход можно активировать с помощью активации «SoftMax» и «категориальной кроссэнтропии», чтобы работать как компонент потерь.

SoftMax обеспечивает распределение вероятностей по классам, тем самым облегчая нейронным сетям интерпретацию вывода. Это нормализованная экспоненциальная функция, которая преобразует вектор из n действительных чисел в распределение вероятностей из n возможных результатов. Категориальная кросс-энтропия используется, когда истинные метки кодируются горячим способом.

Набор данных, используемый для обучения модели, можно сбалансировать с помощью дополненных изображений для устранения любых смещений в наборе данных. Адаптивная скорость обучения может использоваться для обнаружения трех последовательных эпох — если процентное улучшение точности положительное или отрицательное, и на основе этого результата модель может автоматически изменить свою скорость обучения.

Для дополнительных функций через пять эпох модель может переключаться на тонкую настройку, что, в свою очередь, обеспечивает высокий уровень точности обнаружения аномалий в Медицинской визуализации. Затем его можно протестировать с набором данных МРТ и набором данных кожных заболеваний. Параметры оценки, которые можно использовать для понимания эффективности, включают точность, отзыв, оценку f1 и поддержку.

Управление данными пациентов с помощью чат-бота NLP и пользовательского интерфейса

Внедрив NLP чат-бот и интерактивный пользовательский интерфейс, больницы и врачи могут управлять данными пациентов, что дает два преимущества. Во-первых, пациенты могут отслеживать свои отчеты о прогрессе, не посещая клинику или больницу, что сокращает скопление людей и увеличивает доступность назначений.

Во-вторых, управляемая база данных может помочь врачам в разработке лекарств для отдельных пациентов.

Успех до настоящего времени и будущие масштабы

Исследователи перешли от статистических и популяционных прогнозов к индивидуальным прогнозам, что позволяет принимать более эффективные профилактические и терапевтические меры. Примеры терапевтических вмешательств включают использование технологии медицинской визуализации для выявления и лечения рака.

В 2022 году компания Bot Image.ai, занимающаяся медицинской визуализацией из Омахи, получила одобрение FDA на свое программное обеспечение ProstateID. ProstateID может точно определить рак простаты с помощью предварительно обработанной МРТ.

Еще одно решение, получившее одобрение FDA в 2022 году, — это Neosoma HGG, обеспечивающий точность обнаружения опухолей головного мозга на уровне 95,5%. Хотя разработка и принятие этой технологии все еще находится на ранних стадиях, она обещает будущие медицинские достижения.

Хотите развернуть решения для глубокого обучения, чтобы улучшить обнаружение аномалий? Мы стремимся помочь вам. Свяжитесь с нами, чтобы обсудить ваше решение.