В эпоху машинного обучения рандомизированные контролируемые испытания неэтичны

Представляем вычислительную персонализацию: методы науки о данных для персонализированного здоровья

Мауриц Каптейн, главный исследователь лаборатории Nth Iteration Lab, был первым профессором, выступившим со своей инаугурационной речью в Академии наук о данных им. Иеронимуса в часовне Мариенбурга. Ниже приводится полный текст его выступления (PDF со ссылками доступен здесь).

TL; DR согласно Маурицу Каптейну неэтично использовать рандомизированные контролируемые испытания для персонализации здравоохранения, потому что новые методы науки о данных дают лучшие результаты ... (да, существует компромисс между прозрачностью и использованием алгоритмов черного ящика. Если хотите чтобы понять подробности, продолжайте читать)

Вступление

В последнее десятилетие авторитетные научные журналы, такие как Science (Ng et al., 2009) и Медицинский журнал Новой Англии (Hamburg and Collins, 2010), а также законодательные органы, такие как Американское управление по санитарному надзору за качеством пищевых продуктов и медикаментов (FDA) и Европейский Союз (ЕС) подчеркнули важность персонализированного здравоохранения. Персонализируя лечение, когда термин «лечение» охватывает широкий спектр вмешательств, от лекарств до образования и электронного здравоохранения, мы можем повысить их эффективность, снизить затраты и обеспечить лучший уход.

Идея об эффективности персонализации основана на том, что я бы назвал - на современном методологическом жаргоне - существованием неоднородности лечебного эффекта: мы считаем, что эффект от конкретного лечения различен для разных пациентов. В последние десятилетия, благодаря достижениям в широком диапазоне областей от геномики до медицинской визуализации, существование неоднородности лечебного эффекта было твердо установлено. В качестве конкретного примера: в августе 2011 года FDA одобрило лекарство Зелбораф для лечения метастатической меланомы (см., Например, Chapman et al., 2011). Метастатическая меланома - это очень агрессивная форма рака кожи с низкой 5-летней выживаемостью. Зелбораф - это лекарство, которое действует путем ингибирования генной мутации, однако эта мутация обнаруживается только примерно у половины пациентов. Зелбораф неэффективен для людей без мутации. К счастью, мы можем найти мутацию и точно предсказать, для каких пациентов лечение будет эффективным.

Примеры, такие как Zelboraf, показывают, что индивидуальные методы лечения могут значительно повысить их эффективность. Действительно, случай Зелборафа демонстрирует преимущества предоставления правильного лечения правильному пациенту с правильной дозой в нужное время; само определение персонализированного здравоохранения, используемое в ЕС (Scholz, 2015). К сожалению, это определение, на мой взгляд, мало информативно: оно не дает никаких указаний о том, как сделать персонализированное здравоохранение реальностью. Кроме того, определение не разъясняет значение термина «право»; это несмотря на чрезмерное использование этого слова в одном предложении.

Определение персонализированного здравоохранения

Вдохновленный определением ЕС, я дам альтернативное и более конструктивное определение персонализированного здравоохранения. Это альтернативное определение полезно, поскольку оно позволяет нам точно определить ключевые методологические и статистические проблемы, с которыми мы сталкиваемся, пытаясь сделать персонализированное здравоохранение реальностью. После предоставления этого альтернативного определения я буду использовать его для анализа нашего текущего подхода к персонализации лечения, который основан на рандомизированном контролируемом исследовании (РКИ).

Я выделю как преимущества, так и недостатки этого подхода. Впоследствии я сформулирую альтернативный подход к выбору правильного лечения для правильного пациента. Я выделю, почему этот новый метод является одновременно сложным и многообещающим, и буду использовать его, чтобы сформулировать программу исследований в области «вычислительной персонализации».

В попытке переопределить индивидуализированное здравоохранение, давайте вернемся к определению ЕС: «Обеспечение правильного лечения правильному пациенту в правильной дозе в нужное время». Очевидно, важны и пациент, и время, а также выбор лечения и соответствующей дозы. Таким образом, мы можем приступить к постановке нашей проблемы, заметив, что мы ищем некоторую взаимосвязь, некое соответствие между ними и некоторыми связанными с ними последствиями для здоровья. Мы можем более формально обозначить это как

Здесь, по общему признанию, я уже вставляю идею о том, что нам нужно интерпретировать «правильно» по отношению к некоторому интересующему результату.

Основываясь на собственном опыте персонализации приложений электронного здравоохранения под руководством проф. Эмиль Аартс, проф. Панос Маркопулос и проф. Борис де Рюйтер, я изменю это обозначение следующим образом:

где в первой строке я просто меняю порядок членов левой и правой частей. Во второй строке я заменяю «результат» на более удобную - потому что она короче - букву r, обозначающую вознаграждение.

Затем я добавляю некоторую структуру: входные данные отображения могут быть разделены на два набора, которые представляют отдельный интерес:

  1. Первый набор содержит все элементы, которые мы не можем контролировать, часто называемые контекстом, который я обозначаю буквой x. Этот набор включает описание текущего пациента и состояния мира на данный момент.
  2. Второй набор содержит все элементы, которыми мы можем управлять, обозначенные буквой a. Это действия, которые мы можем предпринять, и этот набор включает лечение, дозу и время.

Я не знаю, согласен ли ЕС с этим разделением: подчеркивая важность правильного пациента, они, кажется, подразумевают, что мы можем добиться персонализированного медицинского обслуживания, отбирая пациентов. Я считаю, что мы должны лечить каждого пациента, который приходит к нам на порог.

Наконец, в последней строке я подчеркиваю, что интересующее нас отображение часто может быть параметризовано каким-либо образом; Я использую θ для обозначения этих параметров. Моя интерпретация этой нотации широка: f () может быть чрезвычайно гибким отображением, θ может иметь очень большую размерность, а входные данные могут быть чрезвычайно разнообразными.

Предположим, что мы знаем отображение f () и, следовательно, знаем точный результат каждого лечения для каждого человека. В этом случае индивидуальное медицинское обслуживание просто сводится к следующему:

что означает не что иное, как выбор лечения, которое максимизирует результат для данного пациента.

Это утверждение немного упрощено: на самом деле мы взаимодействуем с несколькими людьми, часто несколько раз, и при каждом взаимодействии выбираем наилучшее действие.

Следовательно, обозначение

где T - общее количество взаимодействий, указывает на то, что мы стремимся максимизировать результат для всей популяции.

В оставшейся части этого выступления я буду использовать уравнение 1 как само определение персонализированного здравоохранения. Персонализированное здравоохранение - это простая, хотя, возможно, и очень многомерная проблема максимизации.

По общему признанию, это немного абстрактно, поэтому, возможно, это легче понять при визуализации. Если мы сосредоточимся на низкоразмерном примере, мы сможем визуализировать взаимосвязь между контекстом, действиями и так далее.

На рисунке 1 показана возможная взаимосвязь между весом пациента (контекст в этом примере), дозировкой лекарства (действие) и вероятностью выживания (вознаграждение). На рисунке показано, что пациентам с низким весом для эффективности требуется низкая дозировка лекарства, а слишком высокая доза может привести к побочным эффектам.

Рисунок 1: Простая визуализация возможных отношений между контекстом, действием и вознаграждением. В этом примере показана (гипотетическая) взаимосвязь между весом пациента, дозировкой (в мг) некоторых лекарств и показателями выживаемости; Очевидно, что для легких пациентов оптимальная доза отличается от оптимальной дозы для тяжелых пациентов.

Панели в нижней части рисунка 1 иллюстрируют проблему персонализации: когда ребенок весом 20 кг представляет себя, контекст фактически фиксирован, и, следовательно, мы смотрим на 2-й фрагмент 3-х мерного графика. Впоследствии мы можем посмотреть возможные дозировки для этого конкретного ребенка и обнаружим, что оптимальная дозировка немного превышает 1/2 мг. Если при следующем взаимодействии нам представят взрослого с весом 60 килограммов, мы посмотрим на другой фрагмент нашего графика и увидим, что оптимальная доза близка к 1 мг. Хотя это очень упрощенная ситуация, этот пример показывает, что до тех пор, пока мы знаем функцию, которая связывает контекст и действия с наградами, мы можем просто выбрать действие, которое приводит к наивысшему результату для каждого пациента, с которым мы сталкиваемся.

Итак, что мы получили благодаря нашему формализму? Во-первых, причудливые математические обозначения для обозначения «правильного лечения и подходящего времени» заставляют нас выглядеть научными ...

Тем не менее, мы также добились определенного прогресса: мы определили «правильный» с точки зрения максимизации некоторого результата и разделили наш набор переменных на те, которые находятся под нашим контролем (доза), и те, которые у нас нет под нашим контролем. контроль (вес). Это важное методологически важное различие. Также мы подчеркнули последовательный характер персонализации; мы выбираем методы лечения при каждом взаимодействии. Эти представления позволяют нам лучше понять проблему, с которой мы сталкиваемся.

Проблемы персонализации лечения

В стилизованном примере, который мы только что рассмотрели, персонализация лечения казалась простой: мы просто вычисляем, какое действие приносит наибольшую награду. Однако на самом деле персонализация - непростая задача. Самая важная причина того, что сегодня большинство методов лечения по-прежнему универсальны (Hamburg and Collins, 2010; Ng et al., 2009), заключается в том простом факте, что мы, в действительности, не знаем взаимосвязи между контекст, наши действия и полученные награды.

Короче говоря, f () в уравнении 1 нам не известно. Это значительно усложняет вычисление того, какое лечение приносит наибольшее вознаграждение. Поскольку мы не знаем f (), мы должны изучить f (), используя ограниченные по своей природе и часто зашумленные данные, которыми мы располагаем. Таким образом, мы не сталкиваемся с кажущейся выполнимой проблемой максимизации, а, скорее, сталкиваемся со сложной проблемой последовательного обучения: по мере того, как мы идем дальше и лечим пациентов, нам нужно постепенно узнавать, какое лечение подходит для кого. Такое последовательное обучение сложно по трем причинам:

1. Высокомерное обучение на основе зашумленных данных

Первая проблема, с которой мы сталкиваемся при разработке персонализированного здравоохранения, заключается в том, что нам нужно изучить f (), используя ограниченные и часто зашумленные данные. Эта проблема обучения осложняется тем фактом, что объем проблемы огромен: с практической точки зрения это означает, что релевантными фоновыми характеристиками пациента являются не только вес, но, скорее, вес, возраст, генетический состав, культура, культура и т. Д. и т.д. и т.п. Аналогично и возможное лечение; мы не просто выбираем дозу, мы выбираем комбинацию вмешательств, лекарств и лечения.

Таким образом, любой метод развития персонализированного здравоохранения должен:

a) иметь дело с неотъемлемой неопределенностью, которая возникает из-за ограниченного числа доступных наблюдений, и

б) найти эффективный способ справиться с чрезвычайно большой проблемой обучения.

2. Изучение причинно-следственных связей

Вторая проблема заключается в том, что то, что извлекается из данных наблюдений, может не отражать должным образом знания, которые мы ищем, а именно эффект изменения нашего лечения. Чтобы проиллюстрировать это, предположим, что мы в настоящее время и наивно решили смоделировать взаимосвязь между химиотерапией (действием) и показателями выживаемости (исходом) для пациентов с раком груди (контекст), используя существующие данные реестра.

По данным наблюдений мы обнаружим, что у тех, кто не получает химиотерапию, выживаемость выше, чем у тех, кто ее получает. Однако такая более высокая выживаемость не вызвана воздержанием от химиотерапии; на самом деле пациенты с легкой опухолью с меньшей вероятностью получат химиотерапию и с большей вероятностью выживут. Таким образом, связь, присутствующая в данных наблюдений, объясняется общей причиной и не дает количественной оценки причинного эффекта лечения.

Поскольку нам нужно изучить функцию, которая явно содержит эффект «вещей, которые мы можем контролировать», нам нужно быть очень осторожными с этим различием.

3. Баланс обучения и заработка

В-третьих, по сравнению с так называемым обучением с учителем - довольно хорошо изученной задачей машинного обучения, в которой компьютер изучает функцию между некоторым наблюдаемым вводом и некоторым желаемым результатом (Hastie et al., 2013) - наша проблема сложна, поскольку у нас нет любые данные о результатах действий, которые мы никогда не пробовали. Следовательно, каждый раз, когда мы выбираем лечение, нам нужно балансировать между выбором лучшего лечения, как это диктуется нашими текущими знаниями, и ценностью опробовать новые методы лечения, которые позволят нам больше узнать о f ().

Эта проблема известна как «компромисс между разведкой и эксплуатацией» или просто «проблема заработка или обучения». Проблема возникает из-за того, что мы должны изучать f () на основе данных с так называемой «бандитской обратной связью»; мы не наблюдаем того, что произошло бы, если бы мы назначили другое лечение (см., например, Ortega and Braun, 2013; Agrawal, 2012; Osband, 2015; Bastani and Bayati, 2015; Eckles and Kaptein, 2014).

Эти три проблемы, изучение сложных функций, которые должным образом моделируют интересующие причинные эффекты на основе обратной связи бандитов, составляют основные задачи науки о данных, связанные с персонализированным здравоохранением.

Наш текущий подход к персонализированному здравоохранению: РКИ

Поскольку у нас уже есть успешные примеры персонализированного здравоохранения - такие как лечение меланомы Зелборафом, которое я представил ранее, - мы должны решить или, по крайней мере, решить связанные с этим проблемы. Давайте посмотрим, как мы сейчас решаем эти проблемы.

Сегодня в доказательной медицине мы обнаруживаем, что рандомизированные контролируемые исследования представляют собой самый высокий уровень доказательности (Evans, 2003; Grol and Grimshaw, 2003). РКИ концептуально прост: случайным образом, например, подбрасывая монетку, мы даем лечение A половине наших пациентов, а лечение B - оставшейся половине. Затем, после лечения заранее определенного количества пациентов n этим способом с помощью лечения A или B, мы исследуем интересующий результат в обеих группах. Если в среднем в группе A результат выше, чем в группе B, мы выбираем лечение A. Для примера подбора дозы это будет сводиться к лечению 100 пациентов низкой дозой, скажем, 1/2 Mg, а еще 100 пациентов. получит большую дозу, скажем, 1 мг. Основываясь на нашем примере функции, приведенной ранее (см. Рисунок 1), наивное рандомизированное контролируемое исследование сделало бы вывод, что доза 1 мг превосходит дозу 1/2 мг, несмотря на неблагоприятные эффекты для детей.

Давайте подробно рассмотрим, как RCT решает три проблемы, выделенные выше:

Высокомерное обучение на основе зашумленных данных:

RCT решает проблему многомерного обучения на основе зашумленных данных двумя способами;

Во-первых, RCT сильно ограничивает проблемное пространство, предварительно выбирая очень небольшое количество действий и контекстов. РКИ сравнивает только два вида лечения и включает очень небольшое количество описаний контекста, только когда основное внимание уделяется персонализированному здравоохранению. Когда нет акцента на персонализации, контекст полностью игнорируется. Какие именно методы лечения и в каком контексте следует сосредоточить, определяется нашим теоретическим пониманием вовлеченного процесса.

Во-вторых, после ограничения проблемного пространства на основе наших существующих теорий, РКИ используют довольно простой метод борьбы с шумом; если, предполагая, что два лечения имеют один и тот же результат, фактически наблюдаемый или более экстремальный результат маловероятен (количественно оцениваемый с использованием магического p-значения, с которым некоторые из вас могут быть знакомы), мы отклоняем нулевую гипотезу о том, что лечение одинаково эффективны и выбирают то лечение, которое имело наивысший средний результат в исследовании.

Изучение причинно-следственных связей

РКИ решает проблему изучения причинного эффекта действий за счет использования рандомизации. «Подбрасывая монетку», мы определяем, кто какое лечение получает, и убеждаемся, что это назначение лечения не связано с характеристиками пациента, такими как «тяжесть опухоли», как в примере с раком груди.

Уравновешивание обучения и заработка

Чтобы оценить, как РКИ решает последнюю проблему, мы должны рассматривать РКИ не только сами по себе, но и включать в него методы лечения, которые назначаются после того, как РКИ было проведено. Например, после следа Зелборафа мы теперь обычно лечим меланому с помощью Зелборафа. Подходя таким образом, мы можем видеть, что РКИ уравновешивает обучение и заработок, сначала проводя заранее определенное количество взаимодействий для обучения (само испытание), а затем переходя к заработку: после испытания результаты принимаются с полной уверенностью, и будущие пациенты получат лечение, которое лучше всего показало себя во время испытания.

Здесь я должен отметить, что RCT по своей сути не является методом персонализации; скорее, это метод выбора одного из двух конкурирующих методов лечения. Однако благодаря проведению РКИ внутри подгрупп пациентов - например, среди всех детей с низким весом - этот метод теперь является золотым стандартом для выбора лечения для определенных подгрупп пациентов.

Преимущества РКИ

Теперь, когда мы понимаем, как RCT решает наши три проблемы, мы можем оценить качество этого подхода. Позвольте мне начать с обсуждения сильных сторон РКИ.

Подход РКИ к многомерному обучению является привлекательным, поскольку за счет строгого ограничения пространства действий и контекста результаты исследования становятся прозрачными и понятными для людей. Хотя очевидно, что качество наших ограничений в пространстве во многом зависит от качества используемых нами теорий - что, боюсь, трудно оценить, - результаты рандомизированного контролируемого исследования, по крайней мере, легко интерпретируемы: выживаемость пациента. в группе, получавшей 1 мг, было больше, чем в группе, получавшей 1/2 мг, и, следовательно, вы получите 1 мг.

Далее, подход РКИ к проблеме изучения причинно-следственных связей чрезвычайно прочен (Рубин, 1978; Имбенс и Рубин, 2015). Нет лучшего метода для оценки причинно-следственных связей, чем рандомизация, и именно в этом РКИ преуспевают.

Наконец, подход RCT к уравновешиванию заработка и обучения практически привлекателен: перемещая все обучение в начало, в след, а весь заработок в результирующие руководящие принципы, мы делаем красивый и удобный детерминированный выбор.

Недостатки РКИ

Наш анализ также позволяет выявить недостатки РКИ.

Прежде всего, выделение очень маленьких подмножеств из всех возможных действий и контекста в последовательных РКИ - поскольку на самом деле мы строим наши знания по одному РКИ за раз - в основном представляет собой ограниченную и наивную стратегию изучения f (). Мы фактически предполагаем, что важны лишь очень маленькие части контекста и лечения, и игнорируем все остальные. Уже в нашем простом примере веса и дозы, представленном ранее, РКИ будет исследовать только небольшое количество конкретных точек в трехмерном пространстве, в отличие от исследования или моделирования всей плоскости результатов. Более того, возможно, неявно, мы предполагаем, что взаимосвязь между контекстом и действиями настолько сложна, насколько позволяют нам понять наши теории.

Другой недостаток RCT проистекает из того, что мы настаиваем на жесткой грани между обучением и заработком. РКИ - и детерминированная стратегия принятия решений, основанная на тесте значимости нулевой гипотезы - заставляет нас либо принять, либо проигнорировать новое лечение, возможно, для некоторой подгруппы людей, с уверенностью. Однако эти определенные решения принимаются на основе зашумленных данных, и, следовательно, полная уверенность - это слишком много, чтобы требовать. Учитывая ограниченные и зашумленные данные, всегда существует ненулевая вероятность сделать неправильный выбор. И чем больше мы пытаемся персонализировать лечение, тем серьезнее становится эта проблема, поскольку на уровне небольших групп пациентов в нашем распоряжении очень ограниченные данные. Если мы действительно верим в неоднородность лечения, то мы должны признать, что каждый пациент уникален, и, следовательно, у нас никогда не будет большой однородной выборки для принятия детерминированных решений.

К сожалению, это не последний недостаток RCT как метода решения уравнения 1; из-за нашего детерминизма данные, которые мы собираем после испытания, также оказывается очень трудным для повторного использования: как только вероятность получения химиотерапии для пациентов с раком груди с тяжелой опухолью равна 1, а для пациентов с легкой степенью опухоль равна 0, мы не можем использовать будущие данные для оценки альтернатив просто потому, что такие данные не собираются. Наши детерминированные решения запрещают наше обучение в будущем.

Набросок альтернативы: вычислительный подход к персонализации

Я хотел бы обрисовать возможный альтернативный метод RCT. Обратите внимание, что я буду только предлагать интуицию для этого альтернативного метода; некоторые технические детали представлены в сносках к стенограмме выступления.

Я предлагаю сделать следующее: Прежде всего, я предлагаю использовать современную и гибкую модель машинного обучения для изучения взаимосвязей между действиями, контекстом и вознаграждением. В последние годы мы стали свидетелями революции в наших способностях изучать гибкие, чрезвычайно многомерные функции (Hastie et al., 2013; Pratola et al., 2016; Mohammadi and Kaptein, 2016; Bishop, 2006), и, следовательно, нет необходимо искусственно уменьшить пространство модели, сосредоточив внимание на очень небольшом количестве характеристик пациента или лечения.

Во-вторых, мы можем использовать новые открытия в нашем понимании причинности; Как оказалось, совершенно не обязательно прибегать к единообразному случайному распределению, как это делается в клинических испытаниях. Скорее, если мы можем вычислить и сохранить вероятность получения лечения, обусловленного характеристиками пациента, мы можем использовать собранные данные для оценки причинных эффектов (Bang and Robins, 2005; Funk et al., 2011).

Наконец, мы можем использовать новые методы уравновешивания заработка и обучения: вместо мгновенного перехода от чистого обучения к детерминированному выбору, как в РКИ, мы можем постепенно уравновесить два. Схема распределения, называемая выборкой Томпсона, позволяет нам со временем постепенно изменять вероятность получения различных видов лечения. Выборка Томпсона выбирает лечение с вероятностью, пропорциональной его эффективности. Таким образом, по мере того, как мы получаем больше доказательств эффективности действия, мы увеличиваем вероятность его выбора. Таким образом мы можем оптимально сбалансировать разведку и разработку (Ортега и Браун, 2013; Осбанд, 2015; Эклс и Каптейн, 2014).

Этот вычислительный подход к персонализации лечения может быть реализован путем отправки наших данных - контекста - на центральный сервер каждый раз, когда мы посещаем врача (или заходим на веб-сайт для получения информации о здоровье, или используем мотивационное приложение электронного здравоохранения). Затем этот центральный сервер оценивает модель, которая связывает контекст, действия и вознаграждения. Эта модель является нашей оценкой выдающейся функции f () в нашем определении персонализации. Наконец, центральный сервер выбирает действие на основе этой модели, уравновешивая обучение и заработок. Обратите внимание, что в результате использования этого метода мы никогда не делаем однозначного выбора между различными методами лечения. Тем не менее, мы делаем лучший выбор, учитывая всю доступную информацию.

По общему признанию, этот вычислительный метод персонализации может показаться немного далеким от реальности, но модели, которые я предлагаю, и методы, с помощью которых можно сбалансировать заработок и обучение, уже, по крайней мере, концептуально, разработаны. Кроме того, мы уже можем передавать большие объемы данных по всему миру за доли секунды; крупные веб-компании, такие как Facebook и Google, делают это постоянно. Поэтому я считаю, что в ближайшем будущем мое предложение технически осуществимо.

Недостатки вычислительной персонализации

В отличие от RCT, я начну с обсуждения недостатков моего вычислительного подхода к персонализации.

Легко приходят на ум два недостатка: первый - «какие переменные, то есть какие контексты и какие действия мы должны включить в такую ​​гигантскую модель машинного обучения?», А второй - «какие результаты нас действительно должны заботить?» Я считаю, что это настоящие вопросы, но они не являются недостатками метода: эти вопросы в равной степени нуждаются в ответах при разработке РКИ.

На самом деле, предлагаемый мной подход обеспечивает гораздо большую гибкость, чем РКИ: мы можем включать большее количество контекстных переменных и потенциально можем собирать данные, касающиеся нескольких результатов. Таким образом, во всяком случае, мое предложение облегчает ответ на эти вопросы, а не затрудняет.

Однако есть более серьезные опасения: во-первых, предлагаемый мной подход теряет, по крайней мере, внешне, все представления о прозрачности. Уже совсем не ясно, почему конкретный пациент в определенный момент времени получает определенное лечение. Это будет скрыто в какой-нибудь модели обучения «черного ящика». Хотя лежащая в основе логика теоретически все еще может быть извлечена из параметров модели, такая перегонка - непростая задача. И, теряя прозрачность, мы, вероятно, также теряем подотчетность; если мы не знаем, почему мы подписываемся на какое-то лечение, то кого мы должны привлекать к ответственности в случае бедствия?

Далее, предлагаемый метод, по крайней мере теоретически, никогда не приводит к определенному, детерминированному выбору. Следовательно, вероятность получения определенного лечения всегда будет отличной от нуля. Это может быть хорошо для таких вещей, как коучинг в области электронного здравоохранения и санитарное просвещение, но нас ждет логистический кошмар, если мы намерены оставить все возможные таблетки доступными во всех аптеках по всему миру на тот маловероятный случай, когда нам придется принять одну из них.

При отказе от РКИ оценка причинно-следственной связи становится более сложной задачей. Как мы можем быть уверены, что модель, которую мы изучаем, на самом деле изучает эффекты нашего лечения, а не изучает какие-то ложные, не причинные связи? Однако в последние десятилетия эта проблема в значительной степени была решена (Bang and Robins, 2005; Funk et al., 2011; Pearl, 2009; Imbens and Rubin, 2015): недавно мы пришли к пониманию того, что, пока мы знаем вероятность Получая лечение, мы можем достоверно оценить причинно-следственные эффекты, даже если лечение не равномерно рандомизировано.

Наконец, реализовать вычислительную персонализацию в предлагаемом мной масштабе будет непросто; лежащие в основе модели и методы все еще разрабатываются, и многие детали еще не закончены. Например, нам нужно иметь возможность обрабатывать большие объемы зависимых данных, которые собираются непрерывно; техническая тема, в которую моя недавно окончившая аспирантуру Лианн Иппель внесла большой вклад (Ippel et al., 2016b, a).

Кроме того, нам нужна инфраструктура, чтобы все это технически работало; недавно Жюль Круийсвейк и Робин ван Эмден проделали огромную работу, чтобы создать платформу с открытым исходным кодом, которая позволяет нам делать именно это, но она требует дальнейшего развития (Kaptein and Kruijswijk, 2016; Kaptein et al., 2016).

Затем нам нужно разработать методы для более быстрого соответствия этим моделям на больших наборах данных; работа, которая в настоящее время выполняется моими коллегами и соавторами Мэтью Пратола и Реза Мохаммади (Pratola et al., 2016; Mohammadi et al., 2015).

Нам также необходимо гораздо лучше понять, как мы можем объединить несколько показателей результатов в одну награду; проблема, которую Ксинтия Кавелаарс будет решать в своем докторском проекте. Это многообещающий проект, которым я имею честь руководить вместе с доктором. Джорис Малдер.

Преимущества вычислительной персонализации

Теперь вы можете задаться вопросом, почему я потрудился предложить этот новый метод.

Мое предложение, похоже, связано с проблемами и требует большой работы; Возможно, работы хватит, чтобы занять меня и моих аспирантов в течение следующих нескольких лет. Цинично вы можете представить, что я предлагаю этот метод именно потому, что я хочу занять себя и своих аспирантов, но это не основная мотивация. Моя настоящая мотивация исходит из преимуществ метода. Или, если быть более точным, его единственное преимущество: с этим методом у нас будет лучший результат.

Это смелое заявление, которое я не могу выразить количественно по шкале, в которой я предлагаю использовать метод. Количество будущих взаимодействий, количество возможных действий и количество значимых контекстуальных факторов просто слишком велико, чтобы сказать что-либо точное. Однако в меньших масштабах, для простых версий проблемы персонализации, мы можем количественно оценить преимущества.

Эффективность метода персонализации можно измерить с точки зрения сожаления: реализованный результат метода по сравнению с результатом, которого мы могли бы достичь с полной информацией. Предположим, мы сравниваем РКИ с моим предложением в простом случае, в котором мы выбираем одно из двух возможных методов лечения для 1000 (гомогенных) пациентов, и где истинная вероятность успеха составляет 0,4 и 0,5.

В худшем случае мы получим ожидаемые 400 успехов, в то время как в лучшем случае мы ожидаем получить 500 успехов. Таким образом, стратегия, которая всегда выбирает самое плохое лечение, приносит 100 сожалений, в то время как случайный выбор лечения дает ожидаемое сожаление в размере 50. В этой ситуации рандомизированное контролируемое исследование имеет ожидаемое сожаление в размере около 36, в то время как мое предложение весит около 12. ; разница в 25 успехов, как показано на рисунке 2a. Эта разница является результатом лучшего баланса между заработком и обучением. Более того, разница увеличивается, когда мы включаем контекст и сосредотачиваемся на все меньших и меньших группах пациентов; это именно то, что мы хотим делать при индивидуальном подходе к лечению.

Если масштабировать проблему до 10 000 решений и 10 возможных вариантов лечения (с вероятностями успеха 0,5 и 0,4 для двух лучших и 0,3 для оставшихся), превосходная производительность вычислительной персонализации становится еще более поразительной: РКИ сожалеет о 800. , в то время как вычислительная персонализация составляет всего 400, как показано на рисунке 2b. Еще более интересно то, что практика последовательных бинарных РКИ определяет лучшее лечение только в 3/4 случаев, в то время как для предлагаемого мной метода вероятность найти лучшее лечение сходится к 1.

Это последнее различие вызвано отказом от простых бинарных тестов для изучения сложных взаимосвязей, как в случае с РКИ, к изучению и сравнению нескольких методов лечения за один раз. Кроме того, эта разница увеличивается, когда мы рассматриваем индивидуализированное лечение, поскольку чем больше мы расширяем пространство контекст-действие, таким образом, чем больше характеристик пациента или лечения мы рассматриваем, тем хуже будет эффективность РКИ.

Наконец, пока мы храним вероятности получения определенного лечения в зависимости от контекста, мы можем эффективно повторно использовать собранные данные; то, что практически невозможно при использовании РКИ. Недавний теоретический анализ Agarwal et al. (2016) показывает, что такое повторное использование данных снижает ошибки оценки наших моделей на порядки. На рисунке 2c показаны оценочные стандартные ошибки как функция количества точек данных, собранных с использованием различных методов. Проще говоря, использование вычислительного подхода к персонализации позволяет нам учиться более эффективно, чем повторные РКИ.

Эти простые вычисления показывают, что предложенная мной альтернатива значительно превосходит РКИ. Более того, разумно ожидать, что RCT будет в большей степени страдать от того, что сделает проблему более реалистичной, чем метод, который я предлагаю. Таким образом, во всяком случае, представленные различия в ожидаемых результатах являются недооценкой фактических результатов, а не завышением.

Заключение

Мне хорошо известно, что я только что представил довольно абстрактную альтернативу РКИ как средству развития знаний и принятия решений в области здравоохранения и наук о жизни.

Очевидно, я понимаю, что вносить изменения в фундаментальный способ развития наших знаний очень страшно. Однако я надеюсь, что к настоящему моменту вы убедились, что недавние достижения в методах исследования, статистическом обучении и науке о данных предоставили нам методы персонализации лечения, которые, несомненно, спасут жизни по сравнению с нашей текущей практикой, исключительно за счет прозрачности и подотчетность.

Для многих эти расходы слишком велики. Эти исследователи придерживаются РКИ как единственного надежного и понятного способа расширения наших знаний. Я не согласен; Я считаю, что нам следует активно рассматривать кардинально разные альтернативы. Мы не должны отказываться от использования новых вычислительных методов, потому что у них есть проблемы, но мы должны попытаться решить эти проблемы. Откровенно говоря, придерживаться РКИ как единственного средства реализации персонализированного медицинского обслуживания в те дни, когда в нашем распоряжении есть технические и методологические инструменты, позволяющие значительно превзойти РКИ, неэтично.

В этом выступлении я попытался честно показать, что альтернативный вычислительный подход к персонализации все еще находится в зачаточном состоянии. Нам нужно развивать это дальше. В связи с этим для меня огромная честь, что с щедрой помощью медицинского страхования CZ и с талантливыми и мотивированными аспирантами, такими как Бас Виллемсе, Илва Хендрикс, Жюль Круийсвейк, Робин ван Эмден и Ксинтия Кавелаарс, мы будем над этим работать. превращение вычислительной персонализации в реальность в контексте вмешательств в области электронного здравоохранения.

Мы сосредоточимся конкретно на электронном здравоохранении, поскольку в этой области приложения интересующие результаты относительно легко измерить, а методы лечения, состоящие из обратной связи, предоставляемой на экранах пользователей, часто легко и дешево экспериментировать. Я искренне надеюсь, что в следующие 4–5 лет мы сможем предоставить убедительное доказательство концепции, согласно которой, используя вычислительную персонализацию, мы действительно можем быть более эффективными, чем при использовании наших текущих стандартов. И если да, то я надеюсь, что наши новые методы науки о данных для персонализации электронного здравоохранения в конечном итоге позволят нам улучшить здравоохранение в целом.

Я поговорил. (и под Я, конечно, подразумеваю Мауриц :)