Генеративные состязательные сети предлагают организациям здравоохранения приложения для лечения пациентов и защиты конфиденциальности

За последнее десятилетие широкое распространение приобрело внедрение систем электронных медицинских карт (ЭМК) в больницах. Это преобразование произошло благодаря Закону о медицинских информационных технологиях для экономического и клинического здоровья (HITECH) от 2009 года, который выделил 30 миллионов долларов в качестве стимулов для больниц и врачей по внедрению систем ЭУЗ. Этот цифровой взрыв в больших объемах медицинских данных поддается современным инструментам машинного обучения, которые можно использовать для множества задач, таких как обнаружение болезней, отслеживание пути пациента, представление концепции, деидентификация пациента и пополнение данных . В прошлом класс моделей глубокого обучения, называемых сверточными нейронными сетями (CNN), успешно применялся для решения множества задач по обнаружению заболеваний, включая задачи классификации, связанные с интерстициальным заболеванием легких, рамками колоноскопии и обнаружением полипов и тромбоэмболий легочной артерии.

Эти усилия были успешными, потому что базовые данные для этих задач обычно содержат достаточное количество положительных и отрицательных примеров для каждого класса обнаружения. В каждом из приведенных выше примеров заболеваний / расстройств у многих людей тесты были положительными, а у многих также были отрицательные. Наличие множества положительных и отрицательных примеров помогает модели машины учиться более эффективно. В случае проблем с обнаружением болезней с дисбалансом положительных и отрицательных результатов методы обучения с учителем, такие как CNN, с трудом работают. Например, модели машинного обучения с учителем могут бороться с редким заболеванием, таким как Эбола, потому что очень немногие пациенты получат положительный результат теста, что приведет к гораздо большей группе отрицательных результатов.

Генеративные состязательные сети (GAN) полезны в этих случаях, потому что они могут научиться создавать поддельные примеры недостаточно представленных данных, лучше обучая модель. Помимо улучшения обнаружения заболеваний, GAN могут использоваться для деидентификации данных, что предотвращает раскрытие личной информации пациента. Правило о конфиденциальности в соответствии с Законом 1996 года о переносимости и подотчетности медицинского страхования (HIPAA) требует защиты информации о пациентах, что означает, что здравоохранение провайдеры должны отнестись к этому серьезно. Деидентификация данных - сложная проблема в области аналитики здравоохранения, потому что традиционные методы недостаточно надежны, чтобы выдержать повторную идентификацию. А именно, большинство современных методов деидентификации могут быть отменены, что ставит под угрозу конфиденциальность личных данных пациентов здравоохранения. Модели GAN, как в исследованиях, так и на практике, предлагают многообещающие решения многих сложных проблем, с которыми сегодня сталкивается здравоохранение.

Что такое генерирующие состязательные сети?

Прежде чем мы перейдем к приложениям GAN для здравоохранения, давайте обсудим некоторые основы их работы. Наиболее важными концепциями, лежащими в основе GAN, являются глубокие нейронные сети (а именно сверточные нейронные сети) и обратное распространение. Учитывая их актуальность, мы должны кратко рассмотреть эти термины.

Искусственные нейронные сети - это математические модели, вдохновленные человеческим мозгом. Они состоят из набора единиц (искусственных нейронов) и связей между единицами (синапсов), каждая из которых имеет веса, которые меняются по мере улучшения обучения в процессе обратного распространения. Чтобы понять обратное распространение, рассмотрите иллюстрацию ниже. Значения ошибок, связанные с предсказаниями нейронной сети, отображаются в сравнении со значениями веса, присвоенными «изученным» функциям. Цель обучения нейронной сети - найти веса, дающие наименьшую ошибку, соответствующую нахождению подножия холма на рисунке. Вы можете представить себе процесс обучения похожим на хождение по холмистой местности, пока не найдете самую низкую точку.

Типичная нейронная сеть представляет собой набор этих взаимосвязанных и взвешенных единиц, которые позволяют моделям фиксировать многомерные и нелинейные отношения между вводом и выводом. Эта структура - одна из причин, почему они так хорошо работают. В контексте анализа изображений низкоуровневые функции, генерируемые нейронной сетью, могут быть краями (то есть краями / очертаниями лица), а высокоуровневые особенности могут быть понятиями, идентифицируемыми людьми, такими как буквы, цифры или лица.

На иллюстрации ниже показан простой пример прогнозирования риска диабета на основе характеристик пациента, таких как возраст, вес, уровень холестерина и статус курильщика. Нейронная сеть выполняет преобразования этих входных данных и разрабатывает важные функции прогнозирования, которые представляют собой нелинейные комбинации входных данных. Затем сеть использует изученные функции для прогнозирования риска заболевания диабетом у пациента.

Примером высокоуровневой характеристики в этом контексте может быть улавливание совокупного эффекта пожилого человека с избыточным весом, который является заядлым курильщиком с высоким уровнем холестерина. Риск диабета у этого пациента, вероятно, значительно выше, чем у молодого, толстого курильщика с высоким уровнем холестерина. Но как насчет пожилого человека с ожирением, который не курит с высоким уровнем холестерина? Является ли некурящий с ожирением более или менее подверженным риску, чем заядлый курильщик с избыточным весом? Человеку будет сложно точно предсказать исход для этих двух пациентов. К счастью, нейронные сети отлично улавливают сложные взаимодействия между этими функциями и то, как они влияют на вероятность результата.

Изображение нейронной сети

Сверточные нейронные сети являются расширениями этих более простых сетей, но они также включают сверточные слои и уровни объединения. На высоком уровне эти слои лучше всего подходят для изучения наиболее важных частей изображений, поскольку они относятся к содержанию всего изображения. Как я уже упоминал ранее, эти высокоуровневые функции могут быть тем, что люди могут идентифицировать. Слой свертки извлекает высокоуровневые концепции (например, лица, буквы, объекты, цифры), а слой максимального объединения сокращает эти функции до наиболее важных, необходимых для обучения.

На изображении ниже показан пример определения наличия опухоли головного мозга на компьютерной томографии пациента. Сверточная нейронная сеть использует сверточный слой для изучения высокоуровневых функций из изображения, которые наиболее точно соответствуют как здоровому мозгу, так и мозгу с опухолями. Соответствующие характеристики могут включать в себя сегменты здоровой ткани мозга, сегменты опухоли, всю опухоль, края опухоли и дополнительные функции, которые не обязательно могут быть интерпретированы людьми, но полезны для машинного обучения. Максимальные уровни объединения уменьшают эти извлеченные функции за счет удаления избыточных сегментов изображения, которые не улучшают обучение. Этот процесс помогает модели определить приоритетность наиболее важных или наиболее часто встречающихся участков изображений, представленных высокоуровневыми функциями, из пикселей изображения.

Изображение CovNet

Иллюстрация сверточной нейронной сети. Иллюстрация Создана автором. Изображение КТ мозга

Теперь, когда у нас есть основы, давайте обсудим GAN. GAN - это набор моделей глубокой нейронной сети, разработанный Яном Гудфеллоу в 2014 году и используемый для получения синтетических данных. Синтетические данные - это любые данные, относящиеся к конкретной ситуации, которые не были получены напрямую посредством реальных измерений.

Цель GAN - обучить дискриминатор различать реальные и поддельные данные, одновременно обучая генератор создавать синтетические экземпляры данных, которые могут надежно обмануть дискриминатор. Дискриминатор - это обычная сверточная нейронная сеть, используемая для различения аутентичных и синтетических изображений, а генератор - модифицированная сверточная нейронная сеть, которая обучена создавать аутентичные фальшивые изображения. GAN обучают дискриминатор и генератор вместе, чтобы многократно улучшать способность дискриминатора обнаруживать поддельные изображения и способность генератора создавать реалистичные изображения.

На приведенной ниже иллюстрации генератор обучается на случайных пиксельных данных шума, а затем генерирует поддельные изображения компьютерной томографии головного мозга. Фальшивые изображения, созданные генератором, затем подаются в дискриминатор вместе с реальными изображениями. Дискриминатор - это обычная CNN, обученная различать настоящие и поддельные изображения. Обучение генератора направлено на создание все более реалистичных поддельных изображений, которые могут обмануть дискриминатор. По мере продолжения обучения генератор становится все лучше в создании подделок, а дискриминатор - лучше различать настоящие и поддельные изображения, пока генератор не будет создавать изображения, которые очень похожи на подлинные изображения. После завершения обучения GAN должен иметь возможность создавать реалистичные изображения, которые можно использовать для дополнения существующих данных или создания полностью новых наборов данных. Увеличение данных полезно в ситуациях, когда в примерах присутствует дисбаланс (например, данные, относящиеся к редким заболеваниям, таким как Эбола). Кроме того, создание новых наборов синтетических данных полезно для защиты конфиденциальности пациентов, а также является альтернативой покупке дорогостоящих медицинских данных с клиническими аннотациями.

Изображение GAN

Иллюстрация порождающей состязательной сети. Иллюстрация Создана автором. Изображение КТ мозга. Шумовое изображение.

GAN в медицинской визуализации

Наиболее распространенные применения GAN в здравоохранении связаны с медицинской визуализацией. Двумя важными задачами медицинской визуализации являются сегментация данных опухолей головного мозга и синтез медицинских изображений.

Сегментация опухоли головного мозга

Интересным применением GAN является сегментация опухоли головного мозга, которая сводится к разделению изображений КТ мозга на объекты изображений, такие как края опухоли, здоровые ткани и целые участки опухоли. Хотя обнаружение большинства типов опухолей головного мозга, таких как глиомы низкой и высокой степени злокачественности, как правило, несложно для врачей, определение границы опухоли путем визуальной оценки остается сложной задачей. В недавнем исследовании Eklund et. al. разработал метод под названием Vox2Vox для выполнения сегментации опухоли головного мозга. В своем исследовании исследователи обучили ансамбль 3D-моделей GAN на наборе данных Brain Tumor Segmentation (BraTS) Challenge 2020 и смогли создать высококачественные сегменты опухоли головного мозга. В частности, их ансамблевая модель была способна обнаруживать целые опухоли, ядра опухолей и активные опухоли с коэффициентами игры в кости ›87% для каждого класса, что превосходит предыдущие исследования с использованием CNN . Эти методы предоставляют средства для создания качественных сегментов опухоли головного мозга, которые могут быть полезны врачам во время анализа, лечения и хирургического вмешательства.

Синтез медицинских изображений

Еще одно интересное применение GAN - это синтез медицинских изображений. Данные медицинской визуализации редко доступны для крупномасштабного анализа из-за высокой стоимости получения клинических аннотаций. Учитывая этот блокировщик, многие исследовательские проекты были направлены на разработку надежных методов синтеза медицинских изображений. В статье 2017 года Campilho et. al. Разработал метод создания синтетических изображений сетчатки глаза. Обучив GAN на изображениях сетчатки из базы данных DRIVE, эти исследователи смогли продемонстрировать возможность создания качественных изображений сетчатки, которых на самом деле не существует. Эти поддельные изображения могут использоваться для увеличения данных в ситуациях, когда количество изображений сетчатки ограничено, и в дальнейшем могут использоваться для обучения будущих моделей искусственного интеллекта. В будущем эти методы можно будет использовать для получения данных для обучающих моделей по обнаружению заболеваний, когда реальных данных недостаточно для обучения точной модели. Кроме того, этот тип данных синтетической визуализации можно использовать для дальнейшей защиты конфиденциальности пациентов.

Создание синтетических дискретных медицинских данных

Хотя GAN чаще всего используются для синтеза медицинских изображений и сегментации изображений, GAN также могут помочь в создании синтетических дискретных данных с несколькими метками. Это полезное медицинское приложение сетей GAN, поскольку оно может обеспечить надежную защиту конфиденциальности пациентов. Как правило, в целях защиты конфиденциальности пациентов методы деидентификации записей ЭМК включают небольшое изменение личных идентифицируемых атрибутов, таких как данные о рождении. Распространенным методом деидентификации является обобщение, при котором такой атрибут, как данные о рождении, может быть обобщен только до месяца и года.

К сожалению, в этом методе все еще существует взаимно однозначное сопоставление между измененными записями и оригиналами, из которых они были получены. Это делает их уязвимыми для атак, когда злоумышленники могут повторно идентифицировать информацию о пациентах. Альтернативный подход включает разработку синтетических данных о пациентах. В 2017 году Sun et. al. разработаны медицинские GAN (medGAN), для создания синтетических многокомпонентных дискретных историй болезни. Используя этот метод, они смогли точно произвести синтетические бинарные и подсчитать переменные, которые представляют события в EHR (то есть: диагностика определенного заболевания или лечение определенным лекарством). Учитывая, насколько сложно получить доступ к данным EHR, medGAN является значительным вкладом в исследования в области здравоохранения, поскольку предоставляет способ генерировать качественные синтетические данные о пациентах. Авторы также представили эмпирическую оценку конфиденциальности и продемонстрировали, что medGAN представляет ограниченный риск при идентификации личности, что дополнительно подтверждает их метод.

Выводы

Учитывая, что сети GAN показали себя многообещающими в области сегментации изображений, синтеза изображений и дискретного синтеза данных о пациентах, они могут произвести революцию в медицинской аналитике. Метод сегментации изображений в медицине может быть расширен до идентификации инородных объектов на медицинских изображениях, обнаружения дополнительных типов опухолевых образований и точного определения структуры органов. Что касается последнего, можно использовать сегментацию изображений с использованием GAN для получения точных структурных деталей мозга, печени, грудной клетки, брюшной полости и печени на МРТ. Кроме того, сети GAN демонстрируют большие перспективы в области синтеза медицинских изображений. Во многих случаях анализ медицинских изображений ограничен отсутствием данных и / или высокой стоимостью достоверных данных. GAN может обойти эти проблемы, позволяя исследователям и врачам работать с высококачественными, реалистичными синтетическими изображениями. Это может значительно улучшить диагностику, прогноз и анализ заболеваний. Наконец, сети GAN демонстрируют значительный потенциал в области конфиденциальности данных пациентов, поскольку они обеспечивают более надежный способ неявного сопоставления реальных данных пациента с синтетическими данными. Эта неявная карта улучшает конфиденциальность данных пациентов, поскольку она не является типичной однозначной картой, и поэтому ее трудно восстановить явно. Улучшения в сегментации медицинских изображений, синтезе изображений и анонимизации данных - все это ступеньки к повышению эффективности и надежности медицинской информатики.