Если бы мы могли изменить конкретное решение в своей жизни, не так ли? Конечно, мы все когда-то думали об этом. По крайней мере, у меня есть. В редких случаях, когда нет, вот небольшая загадка.

Предположим, у вас есть пара сотен (200) пациентов с диагнозом определенного заболевания, скажем, опухоли головного мозга. Половина из них, около 100, перенесли операцию, 20 из них выздоровели. Из оставшихся 100 неоперированных 40 выжили.

Учитывая нового пациента с этим заболеванием, а это все данные, которые у нас есть, вы бы порекомендовали операцию?

Скорее всего, вы говорите (или кричите, если вы такой томофоб, как я) «Нет!» с этой точки зрения. Судя по предоставленным данным, операция не помогает. Скорее, это, вероятно, ухудшает шансы на выживание.

Но что, если бы вам сказали, что 100, перенесшие операцию, были пациентами из группы высокого риска, чьи состояния были опасными для жизни, что побудило врачей сделать выбор в пользу операции. Это меняет всю динамику. Что делать, если эти 100 пациентов не перенесли операцию? Может быть, выжила бы лишь горстка, скажем, 5.

Теперь, если к вам придет новый пациент, вы с большей вероятностью порекомендуете операцию?

Эта проблема настолько сложна, что мы никогда не узнаем, что могло бы случиться, если бы мы могли изменить значения некоторых переменных на основе наблюдаемых данных (например, если бы пациенты, перенесшие операцию, не подвергались операции). Набор или пространство таких примеров что-если известно как контрфакты. Кажется, что наблюдаемые данные раскрывают не всю правду, а только ее версию.

Этот сценарий является примером систематической ошибки отбора, поскольку пациенты были выбраны для операции не случайным образом. Скорее, то, что определило решение, было воспринимаемым риском человека, примером мешающей переменной. В реальных наборах данных есть сотни смешивающих переменных, которые вносят систематическую ошибку в ваши данные и, следовательно, в вашу модель (точно так же, как нет двух абсолютно одинаковых людей, точно так же ни один набор всех смешивающих переменных не будет одинаковым для двух сценариев). Учесть все такие переменные при построении модели невозможно.

Значит ли это, что мы зашли в тупик?

К счастью, нет. Один из способов обойти эти мешающие переменные - провести рандомизированные эксперименты, чтобы уменьшить влияние таких переменных, например, клинические испытания для тестирования лекарств или A / B-тестирование для бета-версии программного обеспечения. Даже в этом случае не всегда возможно провести такие эксперименты в реальном мире для проверки вашей гипотезы. В основном вам приходится полагаться на любые тестовые данные, которые у вас есть, чтобы проверить свою гипотезу, которая опять же имеет много неявной систематической ошибки во время сбора данных и сотен смешанных переменных, которые не были учтены. Вот почему большинство исследовательских работ, посвященных самым современным результатам тестирования, разваливаются, когда сталкиваются с реальными данными после развертывания.

Противоречие - ключевой строительный блок для понимания предвзятости, обеспечения справедливости и проектирования интерпретируемости и надежности моделей машинного обучения. Это помогает моделям машинного обучения нести ответственность за свои решения. Например, если моя заявка на получение кредита была отклонена вашей моделью, как нужно изменить мой профиль, чтобы отменить решение? Такие проблемы широко распространены в критически важных системах, таких как здравоохранение, уголовное правосудие, набор персонала, маркетинг и реклама, а также в финансовых учреждениях.

Поскольку машинное обучение обеспечивает прорыв в производительности во всех других областях с помощью более крупных и лучших моделей, это хорошее время, чтобы сделать шаг назад и отнестись к нашим данным и моделям скептически. Если вы исследователь машинного обучения, это интересное место для изучения.

Если вы занимаетесь производственной практикой, неплохо было бы знать об источнике предвзятости и мешающих переменных в вашей области. Если вы запомните этот простой вышеупомянутый пример, это ответит на множество вопросов о том, почему ваша модель не работает так же хорошо с реальными данными, как с вашими тестовыми данными.

Какие смешанные переменные и какие вопросы возникают в вашей области? Дайте мне знать в комментариях ниже или на [email protected]!