Я обнаружил, что постоянно рассылаю эту статью Хэла Вэриана своим коллегам, так что я мог бы также написать резюме, чтобы возбудить их аппетит и привлечь немного более широкую аудиторию.

Цель этой статьи — познакомить читателей, знакомых с машинным обучением, с принципом вывода о причинно-следственных связях и с тем, как машинное обучение может помочь в улучшении контрфактов.

Проблема Мотивация

Представьте, что вы хотите знать, следует ли вам продолжать или повторять определенную рекламную кампанию. Возможно, вы захотите изучить, как продажи отреагируют на изменение расходов на рекламу, учитывая исторические данные о расходах и продажах. Вы запускаете следующую регрессию:

sales_c = b*рекламные_расходы_c + u_c

Если вы хотите только (в некоторой степени) точно предсказать продажи в зависимости от расходов, а поведение рекламодателя и соответствующая часть мира остаются постоянными, это может быть очень хорошо.

Однако, зная коэффициент b, нельзя определить истинный причинно-следственный эффект рекламных расходов на продажи. Вы не можете быть уверены, что, увеличив расходы на рекламу на 1 единицу, вы увеличите продажи на b единиц.

Что может пойти не так? Возможно, вы заметили, что продажи падают, когда доход от рекламы высок (отрицательное значение b). Но история могла бы заключаться в том, что компания, скорее всего, потратит больше на рекламу, чтобы повысить эффективность неэффективных мест. Сокращение (фактически эффективной) кампании может привести к еще более плачевным результатам. Точно так же, как люди, которые принимают лекарства, чаще болеют, чем люди, которые этого не делают, это не означает, что лекарства делают вас хуже.

Конфаундеры

Но в регрессии всегда есть пропущенные переменные — вот почему у нас есть член ошибки. Но настоящая проблема возникает, когда недостающие переменные влияют как на предиктор, так и на результат. В этом случае мы называем такие отсутствующие переменные вмешивающимися факторами.

Причинные эффекты

Спрашивать о причинно-следственных связях — значит спрашивать, что произойдет с выходом, если мы изменим один вход и оставим другие факторы неизменными.

Например, мы хотим знать, влияет ли рекламная кампания на определенного клиента. В идеале мы хотели бы знать две вещи:

  1. Сколько клиент потратил на рекламу
  2. Сколько клиент потратил бы без рекламы.

Затем мы берем разницу между двумя сценариями, то есть фактическую дополнительную ценность, созданную объявлением.

Но, конечно, мы можем наблюдать только один сценарий (покупатель получает рекламу). Ненаблюдаемый сценарий — это то, что мы называем «контрфактуальным». Оценка неверных фактов является ключом к выводу о причинно-следственных связях или оценке воздействия.

Методы оценки причинных эффектов

Более формально рассмотрим следующие элементы:

A: Результат лечения (наблюдаемый)

B: Исход для нелеченого (наблюдаемый)

C: Исход для леченных, если бы они не лечились (контрфактический сценарий)

Базовое тождество причинного вывода: (А — В) = (А — С) + (С — В).

Мы называем (А — С) «влиянием лечения на леченных», а называем (С — В) «предвзятостью отбора».

Другими словами, если мы посмотрим только на разницу между обработанным и необработанным, мы не всегда сможем отделить влияние от предвзятости.

Методы причинно-следственного вывода призваны помочь вам оценить C. Каждый из них различается по предположению, которое вам нужно сделать о явлении.

Случайный контролируемый эксперимент

Полезно, когда: определение воздействия действительно важно (жизненно важное, сильное воздействие, часто повторяющееся и т. д.), и у вас есть средства и ресурсы, чтобы сделать это, не нарушая права субъекта.

Это золотой стандарт причинно-следственной связи, недостижимый для многих. Хотя онлайн-платформы имеют больше возможностей для этого. Я не буду вдаваться в подробности этой статьи. Вопрос в том, что мы можем сделать, когда РКИ нежизнеспособны.

1. Естественный эксперимент

Полезно, когда: обстоятельства складываются так, что у вас есть некоторая случайность в назначении лечения без явного планирования.

Пример:

  • Факт 1: В игре за Суперкубок в родных городах играющих команд аудитория будет на 10–15% больше, чем в других городах.
  • Факт 2: Компании, желающие размещать рекламу на Суперкубке, должны покупать рекламу заранее.

Ключевая идея. Эти два факта подразумевают, что два фактически случайно выбранных города (по результатам Суперкубка) получат больше расходов на рекламу. Если реклама эффективна, рост продаж в этих двух городах должен быть выше, чем в других городах.

Мы можем использовать данные для неместных городов, чтобы оценить рост продаж (или объемов поисковых запросов) после и до показа рекламы, и использовать это для оценки гипотетического: каким был бы рост без 10–15 % дополнительных показов рекламы в родных городах.

2. Инструментальные переменные

Полезно, когда мы можем определить переменную, которая влияет на результат (продажи) только через ее влияние на наблюдаемые факторы. Этот фактор в основном перемещает факторы независимо от членов ошибки.

Пример. Расходы на рекламу могут определяться на основе факторов, которые также влияют на результат (например, экономические перспективы этого рынка).

Основная идея:

Более формально имеем

y = bx + e

x = az + d

где Cov(z, e) = 0 и Cov(z, x) ≠ 0.

С IV мы оцениваем коэффициент как

b_IV = Cov(z, y)/Cov(z, x).

Эта оценка будет сходиться к истинному среднему значению b (беспристрастность).

Для случаев, связанных с несколькими инструментальными переменными, обратите внимание на двухэтапный метод наименьших квадратов (2SLS), который основан на аналогичных идеях.

3. Прерывистость регрессии

Полезно, когда обработка применяется на основе несколько произвольного порога, и точки рядом с порогом не сильно отличаются.

Пример: если стипендии предоставляются учащимся, набравшим более 80 баллов. Или если правительство решит субсидировать фирмы с числом сотрудников менее 500 человек.

Ключевая идея: учащийся, набравший 79 баллов, не так принципиально отличается от учащегося, набравшего 82 балла. Таким образом, произвольность порога приводит к случайному назначению вокруг порога.

Недостатком этого является то, что, поскольку мы смотрим только на субъектов вблизи порога, эффект, который мы оцениваем локально, может не применяться ко всей популяции, например. студент, набравший 98 баллов, или студент, набравший 30 баллов.

Уловка для явной рандомизации: вместо того, чтобы просто установить (если оценка › порог, провести лечение), можно установить (если оценка + эпсилон › порог, провести лечение). Когда эпсилон мал, это добавляет элемент рандомизации без особых затрат. Однако работы в области государственной политики могут быть не в состоянии сделать это.

4. Разница в разнице

Полезно, когда: у нас есть две группы, леченные и нелеченные, и два периода времени, до и после лечения. Короче говоря, у нас есть панельные данные. Мы оцениваем исход для леченных, если они не лечились.

Пример. У нас есть несколько рынков, например. в разных городах. Мы можем запланировать запуск кампании только на одном рынке и отслеживать продажи до и во время кампании на каждом рынке.

Основная идея: нам нужно предположить, что отсутствие лечения может служить контрфактической причиной отсутствия лечения для группы, прошедшей лечение. То есть мы предполагаем, что обе группы будут иметь одинаковую тенденцию в изменении продаж (предположение о «параллельной тенденции»).

Затем вычисляем:

влияние лечения на леченных = (sTA - sTB) - (sCA - sCB).

Машинное обучение

Машинное обучение может помочь в построении прогностической модели для контрфактических ситуаций, а не только в результате одного сценария, который вы хотите разыграть.

Дополнительная литература по связанным темам

«Моделирование структурными уравнениями» занимается построением конкретной модели поведения, генерирующего данные. Здесь большую роль играют теории.

«Оценка склонности» оценивает вероятность того, что данный субъект получит лечение.

«Графические методы» позволяют анализировать сложные модели, чтобы понять, когда и как можно выявить причинно-следственные связи.

«Causal ML» уделяет особое внимание методам причинно-следственного вывода, которые используют алгоритмы машинного обучения в моделировании подъема.

Ссылка

Причинно-следственный вывод в экономике и маркетинге — Вариан Х.