Как зависимость от искусственного интеллекта может навредить организации

В серии сообщений в блоге я размышляю о некоторых идеях, которые скрываются за современными информационными технологиями. Мое вдохновение для начала серии — эта статья об Эоне о нашем интеллектуальном прогрессе на протяжении веков. В статье Ник Ромео описывает, как новые словечки скрывают от нас мысли и чувства наших предков, даже если они мало отличались от наших. В этом посте я попытаюсь раскрыть некоторые мысли и чувства, которые скрываются за крылатыми словечками машинного обучения и искусственного интеллекта. Я объясняю, почему ученый-компьютерщик призывает своих коллег заняться гуманитарными науками и почему беспристрастные алгоритмы — это миф.

Тот факт, что коммерческий интерес к искусственному интеллекту резко возрос за последние два десятилетия, обычно объясняется экспоненциальным ростом вычислительной мощности и резким падением затрат на хранение данных. Эти две разработки позволили нам обучать машины с постоянно растущим количеством наблюдений. Результаты оказались удивительно успешными. Однако наша зависимость от вычислительной мощности и дешевого хранилища данных также отдаляет нас от реальности, которую мы пытаемся моделировать. Наиболее ярким примером является иногда почти человеческий фанатизм в моделях машинного обучения.

Чтобы понять, как возникает эта дистанция от реальности, нам нужно осознать, что многие из наших моделей машинного обучения работают в социальной сфере. В социальной сфере человеческое взаимодействие является доминирующим фактором. Это гигантское царство. Но мы можем думать о социальных сетях как о типичном примере, где встречаются социальная сфера и машинное обучение. Против применения машинного обучения в социальной сфере есть традиционный аргумент. Аргумент антипозитивизма. Этот аргумент говорит нам о том, что в социальном применении машинного обучения объективность недостижима. Мы люди, поэтому существует субъективность. Мы всегда рискуем приписать наблюдениям, которые мы используем, собственное значение.

Мы также должны понимать, что при разработке модели машинного обучения мы делаем два так называемых позитивистских предположения о реальности, а именно: 1) что она работает в соответствии с общими законами и, 2)что мы можем наблюдать свойства, определяющие такие законы. Эти предположения вполне разумны, когда мы разрабатываем модель машинного обучения для секвенирования геномов. Но поскольку нам необходимо отвергнуть интроспективное и интуитивное знание из наших наблюдений и мы отвергаем метафизику, культурные ценности, нормы и символы, эти допущения не столь разумны для разработки моделей в социальной сфере. Наблюдения, которые мы используем, не содержат всей информации.

Проще говоря, при построении модели машинного обучения мы придумываем собственное значение информации, которой не хватает нашим наблюдениям. Это то, что подвергает эти модели предвзятости. В 2005 году Джон Иоаннидис показал нам, насколько вредны эти предубеждения. В своей статье под названием Почему результаты большинства опубликованных исследований ложны Иоаннидис демонстрирует, что результаты позитивистских исследований в социальной сфере часто совершенно ошибочны. Хотя его утверждения напрямую направлены на академические исследования, факторы, которые, как он утверждает, вносят свой вклад, в равной степени — возможно, даже в большей степени — применимы в других организациях. Эти факторы включают в себя: эксперименты по выдвижению гипотез, гибкие исследовательские планы, большую финансовую и иную заинтересованность в результатах, а также погоню за статистической значимостью. Иоаннидис показывает, что большая часть научных исследований становится точной мерой преобладающих предубеждений. Точно так же преобладающие предубеждения — это те, которые мы часто обнаруживаем в наших моделях машинного обучения. Аналогия лучше всего иллюстрирует опасность.

Представьте себе модель машинного обучения, которую мы преподавали, в виде лошади, тянущей повозку. Лошадь носит шоры. Он не осознает своего непосредственного окружения. Саму повозку ведет кучер. Ученый-компьютерщик. Он или она держит поводья к лошади. Поскольку кучер сидит на приподнятом багажнике, он мог заметить, что Т-Форд мчится справа. К сожалению, кучер пьян. Пьяный. Повозка с лошадью не может избежать столкновения с T-Ford.

Выводы Иоаннидиса, а также аргумент антипозитивизма говорят о том, что мы не можем просто отсеять эти предубеждения в моделях машинного обучения с помощью более строгого применения научного метода. Единственный правильный ответ на использование значительно большего количества наблюдений в моделях машинного обучения — это усилить наши усилия по квалификации этих наблюдений. Чтобы восстановить часть их значения. Я считаю, что мы должны призывать не только к большему количеству гуманитарных наук, но и к более качественным исследованиям в области компьютерных наук. Практический метод, который я предлагаю, таков: Обоснованная теория.