Новые технологии открывают двери новых возможностей в медицине, одна из которых - возможность интерпретировать медицинские изображения с помощью компьютерных систем.

В настоящее время мы находимся на пороге того, чтобы компьютеры выполняли работу, ранее доступную только опытным специалистам.

Диагностика изображений основана в основном на симптомах, которые видны на изображениях, которые мы получаем, например, во время Рентген, КТ (компьютерная томография) или ПЭТ (позитронно-эмиссионная томография). Независимо от того, какое изображение мы хотим использовать, эти системы могут научиться различать изображения и классифицировать их как злокачественные. Такие системы можно было бы даже использовать для интерпретации гистопатологических изображений или, откровенно говоря, любого другого типа. Добро пожаловать в мир, где диагностика стала более точной и автоматизированной, чем когда-либо.

Историческая справка

Первые системы, которые могли диагностировать с помощью базы данных изображений, были разработаны в 60-х и 70-х годах ХХ века. Это были системы, предназначенные для постановки конкретного диагноза и полной замены радиологов и врачей компьютерами.

Такие системы называются ACD - автоматизированная компьютерная диагностика, и их цель - обеспечить полностью автоматизированную компьютерную диагностику.

Сначала с большим энтузиазмом встретили видение компьютерных систем, способных предоставлять информацию на основе медицинских изображений, что раньше было возможно только очень опытным специалистам. Это был период многочисленных инноваций в области технологий и компьютерной техники, поэтому такой энтузиазм не вызвал удивления. Через некоторое время выяснилось, что правильность диагноза, поставленного ACD, была недостаточной и определенно не лучше, чем диагноз, поставленный профессионалом. Это было результатом действия множества неопределенных факторов, которые, как следствие, сделали диагноз непредсказуемым. Из-за этого первоначальное видение замены радиологов компьютерами стало все более и более отдаленным, энтузиазм угас, а медицинская среда, скептически настроенная с самого начала, уменьшилась.

Следующая идея заключалась в изменении подхода - вместо разработки системы, которая полностью заменила бы врачей (что явно не привлекало врачей), было решено работать над системами, которые будут поддерживать медицинских специалистов. На этот раз цель состояла в том, чтобы снабдить врачей дополнительными инструментами, которые помогут им выявлять подозрительные точки или аномалии, но окончательный диагноз будет поставлен специалистом, использующим анализ, предоставленный компьютером. Оказалось, что такое сотрудничество между специалистом, врачом и компьютерной системой повышает эффективность интерпретации медицинских данных.

«Системы нового подхода» называются САПР - компьютерная диагностика, и одна из их характеристик - феноменальный анализ.

Благодаря этому решению можно решить основные диагностические проблемы, такие как, например, уточнение особенностей визуализации данных или расчет параметров конкретных структур. Информация, предоставляемая системами САПР, рассматривается как нечто дополнительное для интерпретации врачом, и, таким образом, мы достигаем синергии между специалистом и системой САПР, которая приводит к более точному диагнозу, чего невозможно было бы достичь иначе. Такое решение - в отличие от систем ACD - было встречено медицинской средой с распростертыми объятиями и успешно использовалось в клинических и даже коммерческих целях, например, в маммографии. Весьма вероятно, что в будущем, когда системы CAD будут все больше и больше улучшаться, можно будет достичь более высокой точности диагностики, чем обеспечивают радиологи.

Контролируемое обучение

Я должен упомянуть несколько различных подходов, которые используют машинное обучение для анализа изображений. Один из них - так называемое «обучение с учителем» - это метод, который классифицирует изображения (объекты) по заранее определенным классам, например это может быть «здоровый» - «рак» или «человек» - «животное» и т. д. Класс - это совокупность паттернов (векторов), которые включают характеристики для этого класса. При обучении с учителем первым шагом является предоставление системе обучающих образов, которые будут использоваться программой для обучения. Каждое изображение в обучающей коллекции имеет уже определенный класс, и, используя эту информацию и характерные особенности этих изображений, можно создать вектор шаблона, описывающий каждый класс. Системы на основе машинного обучения можно охарактеризовать как молодой искусственный интеллект, потому что они делают выводы, используя предоставленные данные, и, как следствие, такие системы способны распознавать объекты - даже без 100% полных данных.

Классификация - это процесс определения того, к какому классу должен принадлежать объект. Для нас важно сделать классификацию максимально эффективной и точной. На конечную эффективность влияют многие факторы, такие как, например, количество образцов в базе данных обучения и метод, используемый для классификации. Лучше всего иметь четкую границу, разделяющую два класса. На рисунке ниже показан такой пример - в этом случае есть 3 класса, которые основаны на двух функциях, извлеченных из обучающих изображений (объектов), и вы можете видеть, что эти классы агрегированы каждый в разных местах. Благодаря этому, как правило, легко классифицировать с большой вероятностью успех новый объект, класс которого неизвестен. В случае классов 2 и 3 может быть место для ошибок, потому что границы недостаточно четкие.

Системы САПР, в зависимости от того, где они используются, основаны на различных методах и алгоритмах начальной обработки, обнаружения признаков и окончательной классификации. В медицине очень важно, какие медицинские данные мы будем анализировать и какие симптомы мы хотим исследовать. Общая статистика такова, что раковые изменения видны только на 0,3% изображений, что на практике означает, что радиолог должен тщательно проанализировать 1000 изображений, чтобы найти 3 из них с аномалиями. Для человека это может быть довольно сложной задачей, но для компьютера и САПР это не так. Более того, он может точно определять количество обнаруженных аномальных изменений, например размер опухоли, форма, яркость. Как упоминалось ранее, система может анализировать множество изображений, но, в конце концов, они все равно передаются рентгенологу (или любому другому специалисту) для подтверждения диагноза системы.

Каждая система распознавания изображений состоит из трех основных элементов:

1. Первоначальная обработка

2. Извлечение функций

3. Классификация

На схеме блока ниже изображен образец системы распознавания изображений.

Первоначальная обработка

Прежде чем можно будет обработать изображение, его необходимо получить. В зависимости от оборудования, используемого для этого, обычно есть датчик (или группа датчиков), отвечающий за сбор данных. Следующий шаг - использовать его для восстановления изображения на экране. Может случиться так, что оно будет некачественным, слишком маленьким или вместо того, чтобы использовать красочную картинку для наших целей, картинка должна быть монохромной (серая шкала). Именно в этот момент происходит первичная обработка изображения - подготовка полученного и восстановленного изображения для дальнейшего анализа. Он может использовать широкий спектр операций, среди которых бинаризация, нормализация или изменение модели окраски (RGB, HSV и т. Д.). Часто нам достаточно рассмотреть лишь небольшой фрагмент изображения, и в таком случае было бы бессмысленно продолжать все анализировать. Лучше, например, используйте фильтр, который будет отличать важную часть от другой или заглушить неважную часть.

Извлечение признаков

Когда изображение будет правильно подготовлено с помощью начальной обработки, пора переходить ко второму этапу - выделению признаков. Этот шаг, как и предыдущий, зависит от целей, для которых мы будем использовать эту систему. Извлечение признаков - это процесс извлечения конкретных признаков / характеристик / параметров, которые видны на изображении и имеют решающее значение для процесса классификации. Например, давайте рассмотрим КТ-изображения легких с раком или без него. При анализе таких изображений мы должны учитывать несколько их аспектов, чтобы определить, действительно ли это злокачественная опухоль: изменение роста, кальцификации, края формы, размера и так далее. Эти вышеупомянутые параметры могут использоваться для определения того, представлены ли на снимке здоровые легкие или нет. Однако важно отметить, что не каждая функция или параметр «достаточно хороши» для использования для извлечения функций. На практике необходимо соблюдать 4 правила:

1. Дискриминация

2. Непогрешимость

3. Независимость

4. Небольшое количество

Дискриминация означает, что выбранная функция должна иметь разные значения для объектов из разных классов. Например, если мы хотим определить, является ли объект мандарином или апельсином, хорошей характеристикой для выбора будет размер, но не цвет - оба фрукта (то есть два разных класса) могут иметь одинаковое значение этой функции и мы хотим этого избежать.

Чтобы функция была «безошибочной», необходимо убедиться, что это одно и то же значение для всех объектов одного и того же класса. Хорошим примером будет выбор цвета кожи для определения класса «человек». Это будет не лучший выбор, потому что у людей может быть много разных цветов кожи, поэтому он не согласован.

Кроме того, функции должны быть независимы друг от друга. Просто бессмысленно анализировать две функции, которые коррелируют друг с другом, например, размер и вес. Это частично связано с четвертым правилом - малое количество, потому что чем больше функций мы используем, тем сложнее становится. Вместо того, чтобы сосредотачиваться на количестве функций, которые мы хотели бы принять во внимание, лучше ограничить количество функций оптимальным минимумом. При практическом подходе вначале первое, что нужно сделать, - это использовать интуитивно выбранную коллекцию функций (шаблон), которая позже тестируется и по результатам, как правило, становится меньше. Сокращение просто исключает признаки, не влияющие на качество результатов классификации. Очевидно, было бы очень дорого опробовать все возможные комбинации функций, особенно если мы учитываем их большое количество в шаблоне. Математически этот паттерн можно описать следующей формулой:

Классификация

Следующим шагом после извлечения желаемых характеристик является классификация изображения, то есть его распознавание и интерпретация. Это этап, на котором требуются более продвинутые и сложные методы, основанные на искусственном интеллекте и статистическом анализе - во многих случаях машинное обучение (ML). Основная цель систем, разработанных на основе машинного обучения, - достичь момента, когда они будут автономно корректировать свое поведение, используя предыдущий опыт. Примерная схема такой системы представлена ​​ниже.

Операции, выполняемые на протяжении всей обработки изображения, можно разделить на низкий и высокий уровень. Обработка низкого уровня не ориентирована на объект, представленный на изображении. Это такие операции, как сжатие, фильтрация шума, резкость или выделение краев. Для высокоуровневой обработки критически важно то, что изображено на изображении, так как на основании этого принимается решение о классификации.

Обработка изображений - очень широкая область. Каждый аспект этого зависит от цели, области или методологии, для которой он будет использоваться. Однако обычно одновременно используют низкоуровневую и высокоуровневую обработку - как уже упоминалось, каждая система спроектирована строго для своего назначения, и именно это определяет ее окончательный вид.