Перевод наблюдений в интервенции

Это 3-я статья из серии о причинных эффектах. В последнем посте мы рассмотрели набор практических подходов к оценке эффектов с помощью показателей склонности. Однако недостатком этих подходов является то, что они не учитывают неизмеряемые искажающие факторы. К концу этой статьи мы увидим, как мы можем преодолеть этот недостаток. Но сначала нам нужно сделать шаг назад и пересмотреть наши представления о причинно-следственных связях.

Ключевые моменты:

  • До-оператор представляет собой математическое представление вмешательства
  • Вмешательство — это преднамеренное манипулирование процессом генерации данных.
  • Используя Структурно-причинную структуру Перла, мы можем оценить эффект вмешательств, используя данные наблюдений.

До этого момента в серии мы (по большей части) применяли классический статистический подход к вычислению причинно-следственных связей. Другими словами, мы разделили наши данные на две группы (например, группу лечения и контрольную группу) и сравнили их средние значения. Однако есть более надежный способ думать о вещах.

Мастер причинно-следственных связей Джудея Перл формулирует вещи в рамках того, что он называет структурным подходом к причинно-следственным связям [1]. Центральным элементом этого подхода является так называемый do-оператор.

Впервые мы увидели оператор do в статье о причинном выводе. Там оператор был представлен как математическое представление вмешательства, которое позволяет нам вычислять причинно-следственные связи. Здесь мы рассмотрим это понятие более подробно.

Средний эффект лечения с помощью Do-Operator

В первом посте этой серии мы определили Средний эффект лечения (ATE) для рандомизированного контролируемого исследования как разницу в ожидаемых результатах между двумя уровнями лечения. . Другими словами, мы сравниваем ожидаемое значение переменной результата (например, есть головная боль или нет) в зависимости от статуса лечения (например, принял таблетку или нет). Это один из наиболее широко используемых подходов к количественной оценке причинно-следственных связей.

В качестве альтернативы ATE в формулировке Перла определяется как разница в ожидаемых результатах между двумя уровнями вмешательства [1]. Здесь в дело вступает оператор do.

Наблюдательные и интервенционные распределения

Ключевое различие между P(Y | X=x)) и P(Y | do(X=x)) состоит в том, что первое определяет вероятность Y при пассивном em> наблюдение X=x, а последнее представляет вероятность Y при вмешательстве в X.

Здесь я буду называть распределение, содержащее оператор do, интервенционным распределением (например, P(Y | do(X=1))), а без него я буду называть наблюдательным распространение. Примечание. Это похоже на различие, сделанное в последнем блоге между обсервационными и интервенционными исследованиями.

Формула 1 против Формулы 2

В контексте рандомизированного контролируемого исследования (РКИ) формулы 1 и формулы 2 эквивалентны. Поскольку лечебные задания намеренно (и тщательно) манипулируются экспериментаторами. Однако, как только мы выходим за пределы RCT (или чего-то подобного), Формула 1 больше не действует, но Формула 2 остается.

Таким образом, мы можем думать о Формуле 2 как об обобщении Формулы 1. Эта новая формулировка дает нам более четкое представление о причинно-следственных связях. Это помогает нам перейти от специальных уравнений для конкретных контекстов к более общей (и мощной) структуре. В следующем разделе мы увидим силу этой формулировки на практике.

Идентифицируемость

Соединение распределений наблюдений и интервенций за 3 шага

Хотя теория и абстракции могут быть полезны, в какой-то момент нам нужно связать их с реальностью (то есть с нашими данными). В контексте причинно-следственной связи возникает вопрос об идентифицируемости. Другими словами,можно ли получить интервенционное распределение из заданных данных?[1]

Как я упоминал ранее, если у нас есть данные интервенционного исследования (например, РКИ), у нас действительно есть интервенционное распределение (это то, что мы тщательно измерили). Но что, если у нас есть только данные наблюдений?

К счастью для нас, Перл и его коллеги уже решили эту проблему [1]. Решение можно разбить на 3 шага.

Шаг 1. Запишите причинно-следственную модель

Каузальные модели были введены в предыдущей серии о причинности. Простая причинно-следственная модель может быть представлена ​​чем-то, называемым направленным ациклическим графом (DAG), который отображает причинно-следственные связи между переменными с помощью точек и стрелок, где A → B представляет A вызывает Б.

Мы видели пример DAG в последнем посте этой серии, который выглядел примерно так, как показано на рисунке ниже. Обратите внимание, что у нас нет (и нам не нужны) детали связей (т. е. функциональных отношений между переменными), а только то, что к чему приводит.

Шаг 2. Оцените условие Маркова

Когда у нас есть DAG, мы можем оценить условие, гарантирующее идентифицируемость. Это называется условием Маркова, и если оно выполняется, то можно определить причинно-следственные связи. Это означает, что мы можем вычислить формулу 2 на основе данных наблюдений (не требуется RCT!).

Условие Маркова состоит из двух частей. Во-первых, граф должен быть ациклическим, что верно для всех DAG (это то, что означает буква «А»). И во-вторых, все параметры шума независимы друг от друга. Этот второй пункт означает, что нет переменных, исключенных из DAG, которые одновременно вызывают какие-либо 2 переменные. Некоторые примеры того, когда это выполняется/нарушается, приведены ниже.

Шаг 3. Превратитенаблюденияв интервенции

Если мы подтвердили, что наш DAG является марковским (то есть удовлетворяет марковскому условию), мы можем выразить любое интервенционное распределение через наблюдательные, используя усеченную формулу факторизации, приведенную ниже.

Чтобы изолировать переменные лечения и исхода в распределении LHS, мы можем просуммировать ковариаты (т. е. все остальные переменные). Например, в простой DAG из последнего блога процесс будет выглядеть следующим образом.

Как мы видим из примера выше, для данного DAG мы должны сделать поправку на ковариату Z. Это то, что мы сделали (интуитивно) еще в посте о причинном выводе. Однако здесь мы получили этот результат из усеченной формулы факторизации, а не полагаясь на интуицию.

Этот трехэтапный процесс дает нам систематический способ расчета причинно-следственных связей на основе данных наблюдений. Ключ, который позволяет нам сделать это, — причинная модель, удовлетворяющая условию Маркова. Мы можем пойти дальше в этом процессе и использовать его для решения проблемы неизмеряемых помех.

Как справиться с неизмеримыми помехами

Проблема сбора данных заключается в том, что переменные иногда трудно или даже невозможно измерить. Это поднимает вопрос о неизмеряемых вмешивающихся факторах, то есть переменных, которые искажают нашу оценку причинно-следственных связей, для которых у нас нет данных. К счастью для нас, в этой структурно-причинной структуре есть решение этой проблемы.

Мы исследуем проблему неизмеряемых вмешивающихся факторов на примере (взятом) из введения Перла [1]. Предположим, у нас есть следующая марковская причинная модель.

Затем, как и раньше, мы можем записать интервенционное распределение P(Y | do(X=x0)) с помощью формулы усеченной факторизации и просуммировать по ковариатам. Алгебра дана на изображении ниже.

Но теперь предположим, что Z_2 трудно (или невозможно) измерить. Как мы можем вычислить приведенную выше оценку с нашими данными? Это действительно возможно, и результат приведен ниже.

Хотя этот последний шаг может показаться волшебством, он исходит из следующего уравнения.

Ключевым моментом здесь является то, что нам нужно измерить только родителей X, чтобы оценить его причинные эффекты. Что делает это выражение действительным, так это условие Маркова, которое требует, чтобы любая переменная (при условии, что она обусловлена ​​ее родителями) была независимо от его не-потомка.

Другими словами, обуславливая Z_1 и Z_3, мы блокируем эту статистическую зависимость между X и Z_2. В следующем блогеэтой серии мы рассмотрим другие возможные сокращения формулы усеченной факторизации.



Как использовать это с показателями склонности

Возвращаясь к последней статье этой серии, мы можем использовать то, что узнали здесь, чтобы улучшить наши оценки причинно-следственных связей с помощью показателей склонности. Чтобы сгенерировать показатель склонности, мы берем набор характеристик субъекта (т. е. ковариатов) и используем их для прогнозирования статуса лечения с помощью, например, логистической регрессии [2]. Однако выбор правильных ковариат — нетривиальный шаг.

Один из способов решить эту проблему — включить в модель показателей склонности только родителей X. Следовательно, если мы потратим время на то, чтобы записать причинно-следственную модель для нашей проблемы, мы сможем выбрать ковариаты простым способом. Например, в DAG выше мы будем включать только Z_1 и Z_3 в нашу модель оценки склонности, даже если измеряется Z_2.



Альтернативный выбор ковариации

Хотя необходимость учитывать только непосредственные причины X является мощным прозрением, что, если родители X не измеряются?

Это побуждает искать альтернативные ковариаты, с помощью которых можно выразить наше интервенционное распределение. Следующий пост этой серии будет посвящен именно этому и обсуждению причинно-следственных связей через DAG.

Ресурсы

Подробнее о причинно-следственных связях: Обзор причинно-следственных связей | Причинность: Введение | Причинный вывод | Причинное открытие

Подключить: Мой сайт | Заказать звонок | "Спрашивай о чем угодно"

Социальные сети: YouTube 🎥 | ЛинкедИн | Твиттер

Поддержка: Купи мне кофе ☕️ | Стать участником⭐️



[1] Введение в причинно-следственные связи Джудеи Перл

[2] Введение в методы оценки склонности для уменьшения влияния смешения в наблюдательных исследованиях Питера К. Остина.