Клиническая цель, представление данных, задача, модель

В этом посте представлен обзор машинного обучения компьютерной томографии грудной клетки, организованный по клинической цели, представлению данных, задаче и модели.

КТ грудной клетки - это трехмерное медицинское изображение в градациях серого, на котором изображена грудная клетка, включая сердце и легкие. КТ используются для диагностики и мониторинга многих различных состояний, включая рак, переломы и инфекции.

Клиническая цель

Клиническая цель относится к медицинскому отклонению, которое является предметом исследования. На следующем рисунке показаны некоторые примеры аномалий, представленные в виде двухмерных аксиальных срезов в объеме CT:

Многие статьи по компьютерному обучению посвящены узелкам в легких.

В другой недавней работе рассматривались пневмония (инфекция легких), эмфизема (вид повреждения легких, который может быть вызван курением), рак легких или пневмоторакс (воздух вне легких, а не внутри легких). легкие).

Я был сосредоточен на прогнозировании множественных аномалий, в котором модель предсказывает 83 различных аномальных результата одновременно.

Данные

Существует несколько различных способов представления данных компьютерной томографии в модели машинного обучения, показанной на этом рисунке:

Трехмерные представления включают в себя весь объем КТ, который составляет примерно 1000 x 512 x 512 пикселей, и 3D-фрагмент, который может быть большим (например, половина или четверть всего объема) или маленьким (например, 32 x 32 x 32 пикселя).

В 2.5D-представлениях используются разные перпендикулярные плоскости.

  • Осевая плоскость горизонтальна, как пояс, коронковая плоскость вертикальна, как оголовье или старые наушники, а сагиттальная плоскость вертикальна, как плоскость лука и стрелы перед лучником.
  • Если мы возьмем один аксиальный срез, один сагиттальный срез и один коронарный срез и сложим их в трехканальное изображение, то мы получим представление среза 2,5D.
  • Если это делается небольшими пятнами, например 32 x 32 пикселя, тогда у нас есть представление патча 2.5D.

Наконец, также используются 2D-представления. Это может быть полный срез (например, 512 x 512) или двухмерный патч (например, 16 x 16, 32 x 32, 48 x 48). Эти двухмерные срезы или участки обычно делаются с осевой проекции.

Задача

В машинном обучении КТ грудной клетки есть много разных задач.

На следующем рисунке показано несколько задач:

Двоичная классификация включает присвоение 1 или 0 представлению CT для наличия (1) или отсутствия (0) отклонения от нормы.

Мультиклассовая классификация предназначена для взаимоисключающих категорий, таких как различные клинические подтипы интерстициального заболевания легких. В этом случае модель присваивает 0 всем категориям, кроме 1 категории.

Многопозиционная классификация предназначена для не исключающих друг друга категорий, таких как ателектаз (коллапс легочной ткани), кардиомегалия (увеличенное сердце) и масса. Компьютерная томография может иметь некоторые, все или ни одного из этих результатов, и модель определяет, какие из них присутствуют.

Обнаружение объектов включает в себя прогнозирование координат ограничивающих рамок вокруг интересующих аномалий.

Сегментация включает маркировку каждого пикселя, что концептуально похоже на отслеживание контуров аномалий и их окраску.

Для обучения этих моделей нужны разные ярлыки. Метки наличие или отсутствие для отклонений необходимы для обучения моделей классификации, например [ателектаз = 0, кардиомегалия = 1, масса = 0]. Метки ограничительной рамки необходимы для обучения модели обнаружения объектов. Маски сегментации (обведенные и закрашенные контурами) необходимы для обучения модели сегментации. Только метки присутствие или отсутствие масштабируются до десятков тысяч компьютерных томографов, если эти метки автоматически извлекаются из радиологических отчетов с произвольным текстом (например, набор данных RAD-ChestCT из 36 316 CT). Получение масок сегментации занимает больше всего времени, поскольку их нужно рисовать вручную на каждом срезе; таким образом, в исследованиях сегментации обычно используется порядка 100–1000 компьютерных томографов.

Модель

Сверточные нейронные сети - самая популярная модель машинного обучения, используемая для данных компьютерной томографии. 5-минутное вступление к CNN см. В этой статье.

  • 3D CNN используются для целых объемов CT или 3D-участков.
  • 2D CNN используются для 2.5D-представлений (3 канала, аксиальный / коронарный / сагиттальный), точно так же, как 2D CNN могут принимать 3-канальное изображение RGB в качестве входного (3 канала, красный / зеленый / синий).
  • 2D CNN используются для 2D-срезов или 2D-патчей.

Некоторые CNN комбинируют 2D и 3D свертки. CNN также могут быть «предварительно обучены», что обычно относится к первому обучению CNN на наборе данных естественного изображения, таком как ImageNet, а затем к уточнению весов CNN на данных CT.

Вот пример архитектуры, в которой предварительно обученная двумерная CNN (ResNet18) применяется к группам из 3 смежных срезов, за которыми следует трехмерная свертка:

Примеры классификации интерстициальных заболеваний легких

В следующей таблице представлены несколько примеров исследований, посвященных интерстициальному заболеванию легких, сгруппированных по клиническим целям, данным, задачам и моделям.

  • Клиническая цель: все эти статьи посвящены интерстициальным заболеваниям легких. Конкретные используемые классы различаются между исследованиями. Некоторые исследования сосредоточены на клинических группах, таких как идиопатический фиброз легких или идиопатическая неспецифическая интерстициальная пневмония (например, Wang et al.2019 и Walsh et al.2018). Другие исследования сосредоточены на паттернах легких, таких как ретикуляция или соты (например, Anthimopoulos et al., 2016 и Gao et al., 2016).
  • Данные: наборы данных состоят из 100–1200 CT, потому что все эти исследования основаны на ручном нанесении меток на участки, срезы или пиксели, что отнимает очень много времени. Преимущество выполнения классификации на уровне патчей, срезов или пикселей заключается в том, что она предоставляет информацию о локализации в дополнение к диагностической информации.
  • Задача: задачи в основном представляют собой мультиклассовую классификацию, в которой каждый патч или срез назначается ровно одному классу из нескольких возможных классов.
  • Модель: в некоторых исследованиях используются нестандартные архитектуры CNN, например Wang et al. 2019 и Гао и др. 2018, тогда как другие исследования адаптируют существующие архитектуры CNN, такие как ResNet и AlexNet.

Дополнительная литература

Первоначально опубликовано на http://glassboxmedicine.com 4 августа 2020 г.