Машинное обучение невероятно быстро проникает в нашу жизнь. Почти каждая отрасль пытается использовать на первый взгляд магические силы, предоставляемые этими алгоритмами. Технология стала настолько распространенной в нашей повседневной жизни, что мы часто не осознаем ее влияния - от музыки, которую мы слушаем, новостей, которые мы доставляем, предметов, которые мы покупаем, до цифровых «друзей», которых мы заводим. Ясно, что эти алгоритмы играют важную роль во многих аспектах нашей жизни, но насколько невинны и чисты эти направляющие влияния? Ведут ли нас к поколению овец-единомышленников, обладающих теми же бессознательными предубеждениями, что и наши цифровые музы? 2018 станет годом, когда волшебный черный ящик глубоких нейронных сетей несколько приоткроется, и нам не понравится то, что мы обнаружим внутри.

Легко увязнуть в шумихе вокруг машинного обучения и ошибочно принять изощренное использование математики за подлинный интеллект, но если вы откроете несколько слоев алгоритмов контролируемого обучения (безусловно, наиболее распространенных из техник машинного обучения), вы мало что обнаружите. больше, чем инструмент для распознавания образов. Эти алгоритмы обучаются на огромных объемах данных, которые позволяют им определять закономерности в предоставленных обучающих примерах, которые позволяют им делать определенные выводы о данных, которые вводятся в них на более позднем этапе. То есть: поскольку было замечено, что человек А купил Предмет X и Y, кажется разумным предложить Предмет X тому, кто недавно купил Предмет Y.

Ясно, что предполагаемый «интеллект» в этих системах полностью основан на данных обучения и заложенных в них паттернов. Учитывая, что нынешний всплеск развития машинного обучения в значительной степени обусловлен непристойными объемами данных, созданными в результате нашего навязчивого использования Интернета, становится тревожным то, что эти алгоритмы строят свои модели мира, основанные в основном на токсичных разделах комментариев и непропорционально западном изображении. мира.

Мобильные приложения, такие как Beauty Meter, используют системы компьютерного зрения для оценки внешнего вида и определения того, какие изменения черт лица могут улучшить его привлекательность. Все эти приложения указывают на явное предпочтение светлой кожи и формы глаз, типичных для белых женщин. Хотя эти приложения не оказывают заметного влияния на общество, они обнаруживают проблему, лежащую в основе многих алгоритмов машинного обучения: они были обучены с использованием данных, которые отражают наши собственные подсознательные предубеждения. Чаще всего эти предубеждения проникают в наши данные без нашего ведома, безусловно, в Интернете больше фотографий белых знаменитостей, чем изображений любой другой расы, но когда вы вводите миллионы точек данных в алгоритм, становится почти невозможно определить какой-либо перекос. которые могут присутствовать в наборе данных.

Microsoft печально известна попыткой запустить чат-бота с искусственным интеллектом по имени Тай в Twitter. Tay был разработан для взаимодействия с пользователями и получения ответов на основе предыдущих онлайн-взаимодействий, в которых он участвовал или наблюдал. В течение 10 минут после развертывания Тай стал гомофобным неонацистом, и инженеры Microsoft сразу же отключили его. Хотя можно утверждать, что люди активно стремились повлиять на Тэя, чтобы представить эти отталкивающие взгляды, это служит иллюстрацией того, насколько чувствительны эти системы к своим обучающим данным и среде, а также дает представление о том, насколько мерзким может быть Интернет как источник данных. .

Алгоритмы машинного обучения (особенно глубокого обучения) являются мощными, потому что им не нужно явно руководствоваться людьми-экспертами и они могут свободно развивать свои собственные ключевые идеи в наборе данных. Это захватывающе, поскольку позволяет обойти определенные ограничения человеческого разума, но также ужасает то, что мы не до конца понимаем, как и почему эти системы работают именно так. Много исследований было направлено на попытки понять внутреннюю работу глубоких сетей и разработать методы интерпретации их внутреннего представления данных. По мере того, как эти методы становятся более изощренными и мы начинаем понимать «мыслительные» процессы этих алгоритмов, кажется неизбежным, что мы столкнемся лицом к лицу с некоторыми из самых уродливых и самых глубоких укоренившихся предубеждений и подсознательных лиц, влияющих на решения. Еще большее беспокойство вызывает тот факт, что эти системы, которые становятся все более необходимыми для наших собственных процессов принятия решений, усиливают эти предубеждения в нас и, следовательно, в самих себе. Круг замкнутый и вращается с постоянно увеличивающейся скоростью. Без продуманного вмешательства это грозит появлением общества овец, обреченных на повторение и закрепление ошибок, зафиксированных в нашей постоянно расширяющейся цифровой истории.