Это вторая часть моей серии вводных статей об ИИ. Вы можете прочитать часть первую здесь.

Как я упоминал ранее, моя цель состоит в том, чтобы найти золотую середину, которая обеспечивает шаг вперед по сравнению с основными определениями, но не отклоняется в сторону технических определений, недоступных для понимания большинства читателей. Я надеюсь, что распространение этой информации позволит людям из самых разных слоев общества вести информированные беседы об этой технологии, обещаниях, которые она предлагает, опасностях, которые она может представлять, и способах ее реализации.

В этом посте я попытаюсь объяснить нюансы того, почему алгоритмы ИИ плохо определяют причинно-следственную связь, и как это должно повлиять на типы вопросов, которые вы ему задаете. Далее я перейду к логической структуре того, как ИИ принимает эти решения, и к полезной схеме, которую можно использовать, чтобы отделить то, что ИИ заявляет о своих действиях, и то, что он делает на самом деле.

Понимание «черного ящика»:

В целом, ключевая информация, которую стоит запомнить, заключается в том, что все алгоритмы AI/ML представляют собой спроектированные опции, которые производят сверхспецифические выходные данные на основе заранее разработанного дерева решений. Разные алгоритмы машинного обучения имеют разные правила, но в конечном итоге пытаются найти точный результат.

Чтобы понять, как AI/ML приходит к этим результатам, мы должны уметь разбивать и идентифицировать составные части. Начнем с того, что «алгоритм» AI/ML в просторечии относится не к одной строке кода, а к четырем различным компонентам, которые при объединении создают алгоритм. Это:

  1. Задача. Это отправная точка, и это проблема, которую вы пытаетесь решить. На этом этапе очень важно понять, что вы хотите измерить, а не какие данные доступны для сбора и использования. Вы должны потратить больше всего времени на эту часть, так как решения, которые вы принимаете здесь, имеют последствия на всем протяжении цепочки. Датафикация (которую мы обсудим позже) должна составлять значительную часть разговора.
  2. Обучающие данные. Самая важная часть обучающего алгоритма, которую часто сложнее всего собирать, создавать или покупать. Чтобы данные были полезными, они должны демонстрировать некоторую взаимосвязь между входными данными (X) и результатом (Y).
  3. Алгоритм тренера. Это то, что люди обычно называют «алгоритмом», но важно отметить, что это только половина алгоритма. Это только создает «правила» на основе обучающих данных, но они не используются в дикой природе (помните об этом). Алгоритму обучения нужны как входные данные (X), так и соответствующие выходные данные (Y), чтобы построить логику перехода от X → Y (мы рассмотрим, как это сделать). будет сделано более подробно позже). Построение этого алгоритма, как правило, очень ресурсоемкое, и часто на него приходится большая часть затрат при разработке алгоритмов AI/ML.
  4. Модель развертывания. Это второй алгоритм, и по сравнению с ним он относительно небольшой, всего несколько строк кода (но это код, разработанный обучающим алгоритмом). Алгоритм развертывания построен с использованием заранее определенных отношений между X и Y, раскрытых алгоритмом обучения. Алгоритм развертывания используется для наборов данных, для которых известны только входные данные (X) и который затем генерирует ожидаемые выходные данные (Y*) — на основе правил, разработанных Алгоритм тренера. Обратите внимание, что вы захотите использовать алгоритм развертывания в наборе данных для оценки до выпуска (о котором мы расскажем в следующем посте).

Причинность Против. Прогноз: распространенная ошибка при использовании ИИ

Одна из распространенных ошибок, которую люди склонны совершать при использовании технологии искусственного интеллекта, заключается в попытке использовать алгоритм машинного обучения для решения проблем причинно-следственной связи, в то время как для них было бы более целесообразно использовать такой метод, как A/B-тестирование. Ошибка распространена, когда люди применяют науку о данных к бизнес-приложениям, где бизнес ищет примеры клиентов, когда действие, предпринятое фирмой (например, предложение сделки), изменит результат поведения этого клиента (например, потратит больше).

В этом типе сценария мы назовем желаемый результат «Y» (текущий уровень расходов человека), а разницу от желаемого результата «∆Y» (насколько изменится этот уровень расходов). Для бизнеса характерно, пытаясь нацелиться на потребителей, которые уже ведут себя определенным образом (Y), использовать данные AI / ML на основе привычек этих клиентов — это неправильный подход. В результате население, для которого они решают, уже соответствует критериям, которые они хотят, и любые дополнительные действия, предпринятые фирмой, не окажут значительного влияния на когорту клиентов.

Вместо того, чтобы использовать алгоритм для определения существующей целевой группы, бизнес должен ориентироваться на людей, для которых бизнес-деятельность оказывает наибольшее влияние (наибольшая ∆Y). Это означает нацеливание на группу потребителей, на которых будут оказывать наибольшее влияние предельные выгоды (такие как продажи или рекламные акции) и которые, скорее всего, превратятся в членов целевой группы (Y) с минимальными усилиями.

Что это значит? Это означает, что ML плохо справляется с проблемами причинно-следственной связи:Поскольку алгоритмы ML имеют входные и выходные данные, они лучше работают там, где доступны обучающие данные (Y), и лучше подходят для прогнозирования. Однако для причинно-следственной связи мы не хотим предсказывать «обученный» вывод, мы хотим понять, как изменяется вывод при изменении ввода. Это требует от нас наличия контрфактуальных данных, чтобы увидеть результат на основе нескольких различных ситуаций.

Подробнее о каузальном ИИ можно прочитать в этой статье, опубликованной в Stanford Innovation Review. Другие также написали на эту тему, и я призываю вас ознакомиться с ними.

Короче говоря, достаточно знать старое изречение из статистики: «Корреляция не предполагает причинно-следственной связи». Применяя это к AI/ML и делая еще один шаг вперед, мы можем сказать, что если вы строите свой алгоритм на основе целевых данных вашей конечной цели, то вы не сможете определить изменения, необходимые для воздействия на результат, чтобы получить когорты с неоптимальным исходом в когорту с оптимальным исходом.

Мы углубимся в каждый из компонентов, перечисленных выше, чтобы лучше понять компоненты, которые являются частью алгоритма, и то, как предвзятость и ошибка могут повлиять на эффективность и точность использования алгоритма.

  • Задание
  • Данные
  • Алгоритм обучения
  • Алгоритм развертывания

Тем не менее, главная тема, о которой следует помнить, заключается в том, используете ли вы алгоритм для выполнения прогноза или попадаете в ловушку, пытаясь определить причинно-следственную связь.