Исследования с Mpirik — возможность исследовать

Большинство компаний-разработчиков программного обеспечения для здравоохранения стремятся улучшить уход за пациентами, результаты лечения пациентов, доходы больниц и эффективность работы врачей. Однако у этих компаний есть огромные возможности также внести свой вклад в научное сообщество с помощью больших данных и междисциплинарных команд.

Mpirik — компания-разработчик программного обеспечения для здравоохранения, специализирующаяся на сердечно-сосудистых заболеваниях. Из многих различных категорий сердечных заболеваний одной из первых целей Мпирика является структурное заболевание сердца. Тяжелый аортальный стеноз является одним из конкретных структурных заболеваний сердца, которым ежегодно страдают более 250 000 пациентов в США. Были проведены обширные исследования, чтобы понять клинические и эхокардиографические переменные, связанные с тяжестью аортального стеноза (АС), и вероятность неблагоприятных клинических исходов из-за прогрессирования заболевания. Было показано, что доступные методы лечения этого заболевания, такие как транскатерная замена аортального клапана, значительно улучшают результаты лечения и качество жизни пациентов. Тем не менее, также широко сообщалось, что основной причиной ухудшения симптомов и плохих клинических результатов является недостаточное лечение (пациенты, не получающие лечения по поводу аортального стеноза). Это недостаточное лечение является центральной проблемой, которую Mpirik стремится решить.

Цель состоит в том, чтобы анализировать медицинские данные, чтобы помочь клиницистам гарантировать, что каждому пациенту с диагностическим исследованием, показывающим признаки тяжелого АС, будет предоставлена ​​возможность пройти обследование для лечения. Поскольку структурные заболевания сердца прогрессируют, знание того, когда обращаться к врачу и когда лечить, является важным решением для клиницистов. Модели машинного обучения способны анализировать большие наборы данных, чтобы помочь клиницистам делать прогнозы, которые следует учитывать при принятии решений о лечении. Таким образом,

Управляемые данными, точные и интерпретируемые модели машинного обучения, которые могут учитывать большие объемы и динамически меняющиеся данные о пациентах для получения вероятности исхода или прогрессирования заболевания, помогут увеличить количество направлений пациентов, тем самым улучшая уход за пациентами и результаты, доходы больницы и эффективность врача.

В дополнение к моделям машинного обучения сочетание больших данных и опытных врачей дает возможность проводить передовые исследования и расширять наше понимание этих заболеваний. Особенно при применении этих же методологий к менее изученным заболеваниям клапанов сердца (VHD), таким как митральная и трикуспидальная регургитация (MR и TR). Mpirik видит эту возможность и создал исследовательское подразделение, призванное помогать врачам-партнерам проводить исследования с их данными.

В оставшейся части этого поста вы познакомитесь с исследовательской стратегией Мпирика, от сбора данных до предварительной обработки и разработки моделей, а также с готовыми моделями и рецензируемыми рукописями.

Сбор данных, предварительная обработка и выбор переменных

Программное обеспечение Cardiac Intelligence™ компании Mpirik анализирует отчеты об эхокардиограммах для выявления пациентов с признаками сердечных заболеваний. Результаты диагностики из больничной ЭМИ безопасно передаются в режиме реального времени в Mpirik, систематизируются с использованием обработки естественного языка (NLP) и анализируются алгоритмами Mpirik на предмет критериев сердечно-сосудистых заболеваний. Основное внимание уделяется оказанию помощи линиям обслуживания сердечно-сосудистых заболеваний в улучшении выявления сердечно-сосудистых заболеваний, а также отслеживанию пациентов в процессе прогрессирования заболевания для устранения недостаточного лечения.

В дополнение к эхокардиографическим переменным мы обычно собираем дополнительные данные от клиницистов, такие как причины госпитализации, сопутствующие заболевания, лабораторные анализы и записи о смерти.

Гипотеза описывает методологию, а хорошая методология дает надежные результаты.

Как правило, наши исследовательские вопросы связаны с прогнозированием клинических исходов и прогрессирования заболевания в больной популяции с использованием логистической регрессии и анализа выживаемости. В гипотезах, касающихся анализа выживаемости и времени до события, также важно выбрать соответствующую правую границу для сбора данных, поскольку это повлияет на цензуру.

После извлечения данных важно тщательно их изучить и очистить. Непрерывные переменные, которые содержат более 70% пропусков, удаляются; однако недавно мы изучили методы множественного вменения, основанные на методах регрессии и кластеризации, чтобы надлежащим образом обрабатывать отсутствующие данные. Предикторы (независимые) и ответные (зависимые) переменные, которые являются категориальными, например наличие мерцательной аритмии или шкала NYHA, кодируются как целые числа.

Переменные могут взаимодействовать друг с другом из-за коллинеарности и избыточности. Таким образом, мы используем строгие методы выбора переменных для уменьшения размерности. Например, анализ главных компонентов (PCA) объединяет две или более переменных (т. е. средний аортальный градиент и скорость струи) в одну или несколько ортогональных переменных, которые содержат независимо значимый объем информации.

Выбор переменных для окончательной многомерной модели основан на методе проб и ошибок, основанном на гипотезах. После уменьшения размерности мы сообщаем описательную статистику, сравнивающую распределения непрерывных и категориальных переменных между двумя совокупностями. Мы сравниваем средние значения непрерывных переменных, используя t-критерий Стьюдента, и распространенность категориальных величин, используя статистику хи-квадрат или двухпропорционный z-критерий. Кроме того, мы выполняем одномерную логистическую регрессию, чтобы определить ключевые предикторы, связанные с переменной отклика. Список переменных, показывающих значимость, обсуждается с экспертами-клиницистами для обсуждения соответствия нашей рабочей гипотезе.

В настоящее время мы изучаем осуществимость других методов, таких как плавно усеченное абсолютное отклонение (SCAD), которое сокращает оценки малых коэффициентов, оставляя относительно нетронутыми большие, значимые коэффициенты.

Разработка и итерация многомерной модели

Окончательная многомерная модель выбирается из списка значимых одномерных кандидатов. Хотя существуют пошаговые автоматизированные методы для сокращения списка возможных предикторов, мы предпочитаем вручную повторять комбинацию переменных на основе клинических знаний, потому что неконтролируемый пошаговый выбор переменных может привести к узко оцененным доверительным интервалам, искусственно увеличивая значимость предиктора. переменных и нашей уверенности в модели. Кроме того, контролируемый выбор переменных позволяет нам действительно думать о гипотезе, когда мы принимаем эти решения.

Даже при тщательно построенной гипотезе выбор подходящей модели не всегда прост.

Например, при анализе выживаемости можно использовать описательный подход (Каплана-Мейера), полупараметрический подход (модель пропорциональных рисков Кокса) или параметрический подход, который заставляет нас предположить (и проверить достоверность) распределение, обычно распределение Вейбулла. Преимуществом последнего является возможность экстраполяции, что особенно важно, когда у нас есть узкие временные рамки сбора данных.

После того, как модель разработана, мы можем проверить ее точность и воспроизводимость, выполнив внутри- и вневыборочные оценки. Кривые рабочих характеристик приемника (ROC) являются нашим предпочтительным методом из-за широкого применения в клинической области и интуитивно понятной интерпретации площади под кривой (AUC). Эта кривая отображает чувствительность и специфичность модели на основе различных пороговых значений от результирующей вероятности модели. Оптимизация ROC может дать рекомендуемый порог отсечения, который обеспечивает полезность при прогнозировании результата при развертывании полученной модели в качестве продукта.

Публикация и реализация модели

Результатом нашего исследования является публикация в рецензируемом журнале, реферат и постерная презентация на конференции или продуктизированная модель с использованием Amazon Web Services и Sagemaker. В настоящее время у нас есть ряд публикаций и рефератов на рассмотрении, и мы развернули модели прогрессирования заболевания.

Другие проекты в работе варьируются от разработки модели стратификации пациентов с АС в возрасте COVID до определения клинических и эхокардиографических предикторов прогрессирования заболевания и неблагоприятных клинических исходов при умеренном АС (Gada et al., 2020), MR и TR (в обзоре) к недавним проектам, посвященным неравенству в уходе.

Секрет нашего успеха — в привлечении ведущих клинических специалистов.

Mpirik отличается способностью быстро извлекать и эффективно анализировать данные по любому вопросу исследования. Однако секрет успеха заключается в привлечении ведущих клинических специалистов, которые делятся своими клиническими знаниями и опытом при анализе наших результатов во время разработки и развертывания модели.

Благодаря совместной работе между клиническими экспертами и компаниями, обладающими опытом работы с данными, для эффективного анализа больших данных можно добиться улучшения медицинского обслуживания пациентов и продвижения научных знаний.

Чтобы узнать больше, посетите сайт Mpirik или свяжитесь с нами по адресу [email protected]

Использованная литература:

Гада, Х., Вора, А., Рамлави, Б., О'Хэйр, Д., Сотело, М., Роджерс, К., Вагнер, Л., Бригман, Л., Кохли, Н., Клинические и эхокардиографические исследования Предикторы прогрессирования заболевания аортальным стенозом и клинические исходы у больных с умеренным аортальным стенозом [аннотация]. В материалах 69-го ежегодного собрания Американского колледжа кардиологов; 2020 28–30 марта; Чикаго, Иллинойс