Ключевые выводы:

  • Глубокое обучение автоматически обрабатывает сложные наборы данных с минимальным набором функций. В результате специалисты здравоохранения подбирают пациентам необходимое лечение намного быстрее, чем они могли с помощью предыдущих моделей машинного обучения.
  • Плюсы и минусы различных моделей предикторов. Какие существуют модели предикторов? Как аналитики могут выбрать правильный, исходя из конкретной бизнес-цели и правильного баланса интерпретируемости и точности?
  • Пример использования. Используя глубокое обучение, компания Axtria, Inc. спрогнозировала вероятность того, что врачи будут назначать конкретным пациентам определенные лекарства с точностью более 80%, что примерно на 10% больше по сравнению с предыдущими методами.

В фармацевтике, особенно в специализированных областях, таких как онкология, точная медицина требует точного понимания когорт пациентов и необходимых им лекарств для улучшения результатов. Однако разные типы пациентов затрудняют поиск подходящего пациента к нужным лекарствам. В таких случаях глубокое обучение (DL) автоматизирует правильное лечение когорт пациентов для нужных пациентов в нужное время без ручной разработки функций. ¹

Расширяя возможность погружаться в сложные источники данных, такие как многомерные данные о пациентах, DL раскрывает новые и точные идеи, помогающие принимать решения, которые могут положительно повлиять на результаты лечения пациентов.

Выбирая шаблоны из сложных данных автономно с минимальным контролем человека, модели DL могут:

  • Делайте более точные и точные прогнозы.
  • Помогите интерпретировать сложные неструктурированные данные.
  • Добивайтесь значимых результатов, раскрывая глубокие и конкретные идеи.

В настоящее время профессионалы используют DL для множества медицинских приложений, включая диагностику диабета путем анализа изображений сетчатки глаза, обнаружение рака кожи путем анализа изображений кожи и несколько недавних анализов данных электронных медицинских карт (EHR).

Реальные приложения искусственного интеллекта

Недавно Google AI продемонстрировал влияние приложения DL. ² Они предсказали вероятность повторной госпитализации пациента с высокой точностью, применив DL к данным EHR. В моделях использовались тысячи потенциальных переменных-предикторов в картах пациентов. В свою очередь, модель указала на конкретные события в истории пациента, чтобы понять, почему они могут быть повторно приняты.

Их результаты были статистически значимыми. По шкале, где 1,00 - идеально, а 0,50 - не лучше, чем случайный случай, результаты превзошли традиционную логистическую регрессию следующим образом:

  • 0,86 при прогнозировании длительности пребывания пациентов в больнице по сравнению с 0,76 при использовании традиционных методов.
  • 0,95 при прогнозировании стационарной смертности по сравнению с 0,86 при использовании традиционных методов.
  • 0,77 при прогнозировании неожиданной повторной госпитализации после выписки пациентов по сравнению с 0,70 при использовании традиционных методов.

В совокупности DL превзошел традиционные методы почти на 10%. В целом, Google продемонстрировал высокую эффективность DL при извлечении информации из больших объемов данных за вычетом ручного включения.

Подходы DL к прогнозированию усыновителей пациентов

Как правило, существуют два широких метода определения пациентов, усыновивших ребенка. Модели классификации позволяют получить представление о всех группах пациентов. С другой стороны, более конкретные модели дают представление о конкретных группах пациентов.

Классификационные модели разработаны, чтобы предвосхитить их для всех групп пациентов. Поскольку этот метод учитывает всех пациентов в одном наборе данных, существует риск получения общих сведений. В конечном итоге он предоставляет уникальный набор идей для нескольких разных типов пациентов под одним зонтом.

Пациентам в специализированных областях, таких как онкология, требуется специфическое лечение. Поскольку каждый пациент уникален, модели, позволяющие получить представление о различных когортах пациентов, являются идеальными. В этих случаях модель группирует пациентов со схожими характеристиками с точки зрения их схем лечения.

Следовательно, неконтролируемый DL полезен для автоматического создания определенных когорт пациентов для прогнозирования усыновителей. Для этого эти модели извлекают особенности из тысяч входных переменных, устраняя сложность многомерных наборов данных без ручного вмешательства. Шаги по созданию этих групп пациентов следующие:

  1. Идентифицируйте когорты пациентов, используя неконтролируемые методы, такие как ограниченные машины Больцмана и автокодировщики.
  2. Разработайте индивидуальные модели для оценки вероятности принятия пациентом интересующего препарата. Модель можно интерпретировать, чтобы определить, какие характеристики пациентов (т. Е. Сопутствующие заболевания, демографические данные, схемы лечения в прошлом, лечащие врачи и медицинские работники и т. Д.) Будут стимулировать принятие.

Плюсы и минусы различных моделей прогнозирования

Выбор модели требует понимания бизнес-цели, а также преимуществ и недостатков различных моделей прогнозирования. При этом очень важно выбрать точную, но интерпретируемую модель.

Несмотря на свои различия, модели обычно следуют схожей структуре моделирования. Во-первых, модель разделяет данные на наборы для обучения, проверки и тестирования. Затем их можно использовать в качестве классификаторов для прогнозирования принятия препарата пациентом.

К таким моделям относятся:

  • Модель логистической регрессии: эта модель идеальна, когда зависимая переменная является дихотомической (двоичной). Логистическая регрессия описывает данные и объясняет взаимосвязь между одной зависимой двоичной переменной и одной или несколькими номинальными, порядковыми, интервальными или зависимыми переменными на уровне отношений. ³ Это легко интерпретируется, поскольку коэффициенты модели указывают на наиболее важные факторы принятия. Однако эта модель менее точна, чем другие, и страдает при вводе данных более высокой сложности.
  • Нейронные сети (NN): NN, спроектированные как человеческий мозг, состоят из слоев множества взаимосвязанных нейронов. Каждый нейрон, или «эксперт», сопоставляет данные из нижележащих слоев и нелинейно передает информацию слоям, находящимся над ним. С точки зрения точности типичная NN превосходит другие модели машинного обучения. Однако модель иногда трудно интерпретировать из-за нескольких промежуточных слоев. По этой причине многие часто называют NN «черными ящиками».
  • Ансамблевая модель. Ансамблевые модели объединяют лучшие прогнозы нескольких моделей для каждого пациента, чтобы компенсировать неточности других моделей. Эта модель, использующая «ансамблевое обучение», объединяет сильные стороны нескольких моделей, обеспечивая высокую точность. Однако смешение моделей разных типов означает потенциальные трудности в интерпретации ее результатов.

Аналитики также могут комбинировать лучшие прогнозы каждой модели для получения прогнозов с более высокой точностью, используя ансамблевое обучение. В будущем ИИ будет продолжать развиваться за счет повышения интерпретируемости и, как следствие, более точного прогнозирования факторов, ответственных за принятие решений.

Пример использования: использование DL для точного прогнозирования усыновителей пациентов

Axtria, компания, занимающаяся большими данными и аналитикой в ​​области биологических наук, оценила вероятность того, что врачи пропишут пациентам определенные лекарства, на основе информации из их медицинских заявлений. Используя полученные знания, Axtria помогла коммерческим руководителям лучше понять поведение пациентов и разработать целевые коммерческие стратегии. Впоследствии полученные сведения увеличат вероятность назначения лекарств.

Методология

Как правило, достижения AI / ML используют данные EHR для извлечения подробных описаний диагноза, процедур и приема лекарств у пациентов. Вместо этого Axtria использовала данные о заявках для определения характеристик пациентов, которые данные EHR могли не предоставить.

Действия Акстрии были следующими:

  1. Выберите наиболее подходящую модель прогнозирования.
  • Создавайте когорты пациентов с помощью бесконтрольного DL.
  • Определите цель вывода идей. В нашем случае заинтересованные стороны хотели лучше понять движущие силы принятия лекарств пациентами.
  • Выберите модель прогноза. Мы выбрали легко интерпретируемую модель случайного леса, чтобы позволить нам получать информацию - модель, аналогичную модели ансамбля.

2. Анализ данных о претензиях

  • Определите прошлые характерные особенности пациентов, основанные на лечении, на основе аналитических данных по заявкам, включая сопутствующие заболевания, демографические данные и их поставщиков / медицинских работников.
  • Получение характеристик пациентов на основе данных о заявках, таких как схемы лечения противоопухолевыми агентами, прогнозы рынков и анализы, а также расстройства и другие осложнения.
  • Используйте анализ данных о претензиях, чтобы связать пациентов с поставщиками услуг.

Исходя из данных о заявках, определенные характеристики пациентов, которые мы определили, были важны для прогнозирования принятия лекарств, например:

  • Схемы лечения противоопухолевыми средствами.
  • Прогнозы рынков и тестов.
  • Расстройства и другие осложнения.

Результаты

Подход давал результаты с точностью более 80% - это примерно на 10% больше по сравнению с предыдущими методами, как по точности, так и по запоминаемости. В частности, результаты показали, что:

  • Пациенты с более высокой частотой тестов, назначенных врачом, с большей вероятностью принимали препарат.
  • Чем больше у пациента сопутствующих заболеваний, тем меньше вероятность того, что он будет принимать препарат.
  • Региональные различия пациентов и типы больниц, в которых они получали лечение, сыграли значительную роль в принятии пациентами этого препарата.

Заключение

Примечательно, что региональные различия пациентов и типы больниц повлияли на их шансы на усыновление по нескольким причинам. Во-первых, в одних регионах влияние GPO более существенно, чем в других. Во-вторых, некоторые академические больницы имеют более сильную исследовательскую поддержку и стремятся к клиническому «чемпионству». Следовательно, они более открыты для пробования новых лекарств.

Для руководителей продаж полученные знания имели решающее значение для разработки целевых сообщений для медицинских работников, которые помогают им принимать обоснованные решения о лечении. В конечном итоге эти сообщения приводят к увеличению количества рецептов.

Будущее глубокого обучения

В настоящее время технологии искусственного интеллекта, такие как DL, позволяют получать информацию гораздо эффективнее, чем ручная инженерия. Последнее менее полезно и требует экспертных знаний в предметной области, которые иногда недоступны. По сравнению с людьми DL закрывает эти пробелы в знаниях и может быстрее и эффективнее предвидеть пациентов, принимающих лекарства.

Предоставление полезной информации о том, как пациенты принимают определенные лекарства, является важным шагом, определяющим бизнес-стратегию для руководства. Более того, эти идеи предлагают торговым представителям боеприпасы во время взаимодействия с HCP. Например, результаты предоставляют им информацию о препарате, информацию об их эффективности при лечении определенных болезненных состояний и тому подобное.

DL продолжит действовать как катализатор точной медицины. В будущем прогнозирование усыновителей потребует понимания схем рецептов конкретных типов пациентов. К счастью, DL извлекает полезную информацию из большого объема и разнообразных данных более эффективно и точно, чем люди.

В будущем понимание состояния здоровья пациентов потребует объединения источников данных, например. геномика, датчики пациента (IoT) и подробные медицинские записи. Это означает, что следующая большая задача будет включать в себя преодоление проблем, связанных с различными стандартами данных, охватом и другими сложностями. Однако инструменты искусственного интеллекта будут постоянно совершенствоваться, чтобы мы лучше понимали такие идеи.

Заинтересованы в подобной информации? Прочтите, как Axtria использовала AI / ML для получения более точной информации из неструктурированных данных в EHR.

Источники:

  1. Авторы Википедии. (2019, 28 мая). Feature Engineering. В Wikipedia, The Free Encyclopedia. Получено в 15:05, 19 июля 2019 г., с сайта https://en.wikipedia.org/w/index.php?title=Feature_engineering&oldid=899189316.
  2. Rajkomar, A., MD. (2018, май). Deep Learning for Electronic Health Records. В блоге Google. Получено с https://ai.googleblog.com/2018/05/deep-learning-for-electronic-health.html
  3. Что такое логистическая регрессия? (2019). В Статистических решениях. Получено с https://www.statisticssolutions.com/what-is-logistic-regression/
  4. Чикарман В., Бхамидипати С. «Приложения машинного обучения в коммерческих науках о жизни». Представлено Axtria на Зимнем симпозиуме PMSA 2019.