Для любого, кто обращал внимание, не останется незамеченным тот факт, что в прошлом году произошло резкое расширение использования технологии распознавания лиц, в том числе в школах, при пересечении границы и во взаимодействии с полицией. Совсем недавно Дельта объявила, что некоторые пассажиры в Атланте смогут пройти регистрацию и пройти проверку безопасности, используя для идентификации только свое лицо. В большинстве новостей, посвященных этому объявлению, подчеркивалось предполагаемое удобство, эффективность и техническая новизна, но при этом не учитывались любые потенциальные опасности. На самом деле, однако, сочетание широко доступных изображений, возможности использования существующей инфраструктуры и правовой среды, налагающей очень мало ограничений на запись, означает, что распознавание лиц представляет собой уникальную угрозу конфиденциальности, которая должна нас сильно беспокоить.

Происхождение идеи

По сути, задача распознавания лиц - это то, что называется проблемой классификации. То есть, учитывая изображение кого-либо, вернуть решение «да» или «нет» относительно того, соответствует ли это изображение существующей записи. Мы редко задумываемся, как это замечательно, что мы, люди, можем делать это так легко. К сожалению, мы также не можем объяснить, как именно мы это делаем, или разбить процесс на этапы, которые можно было бы запрограммировать в компьютере. Таким образом, автоматическое распознавание лиц стало возможным благодаря обнаружению статистических закономерностей в больших наборах данных с помощью машинного обучения. В частности, современные системы «глубокого обучения» работают, изучая серию математических преобразований, которые преобразуют входное изображение и существующую запись в одно число - вероятность (согласно компьютеру) того, что они совпадают.

Идея использования фотографий для идентификации людей имеет долгую историю, восходящую к самым истокам фотографии. Как известно, фотографии использовались полицией для идентификации коммунаров после разгрома Парижской Коммуны в 1871 году, но систематическое использование фотографии для этой цели действительно началось с системы «Бертильонаж», разработанной Альфонсом Бертильоном в 1879 году. сами по себе были бесполезны для идентификации неизвестных людей, если только не удалось сначала сузить набор возможностей.

Чтобы решить эту проблему, Бертильон предложил провести серию из одиннадцати измерений у любого арестованного, например, ширину головы и высоту правого уха. Эти измерения (каждое квантованное как малое, типичное или большое) вместе сформировали своего рода код, который можно было использовать в качестве индекса в карточном файле, эффективно предварительно фильтруя набор возможных совпадений, используя технику, которую мы теперь называем «Хеширование».

Сами карты включали имя человека, стандартизованную пару фотографий (вид лица спереди и в профиль) и другие опознавательные знаки, такие как шрамы и татуировки, что позволяло идентифицировать любого, кто ранее был арестован. В современном переосмыслении этой системы наше лицо стало индексом, и записи, которые оно извлекает, теперь содержат гораздо больше данных о нас, чем кто-либо мог представить в первые годы криминологии.

Как получилось, что теперь мы можем автоматически делать то, что не мог Бертильон? Отчасти причина в том, что компьютеры позволили эффективно хранить и проверять огромное количество записей. Но что еще более важно, машинное обучение позволило нам разработать программное обеспечение, способное (до некоторой степени) обобщать то, с чем оно ранее сталкивалось. Такие факторы, как изменение освещения или выражения, могут существенно повлиять на фактическое содержание пикселей изображения. Однако, обучаясь на миллионах фотографий, системы машинного обучения часто могут отличить «сигнал» на изображении - в данном случае распознаваемое лицо - от «шума» - различных условий освещения или угла обзора. лица.

На каком-то уровне это конкретное приложение машинного обучения, кажется, позволяет обойти некоторые из общих опасений по поводу алгоритмической справедливости, которые сегодня широко обсуждаются. В отличие, например, от проблемы прогнозирования того, совершит ли кто-либо другое преступление, идентификация кого-либо по фотографии не требует никаких предположений о будущем поведении или скрытых чертах. Либо фотография является вашим изображением, либо нет, и это не требует создания проблемных категорий, таких как вероятность рецидива. Однако факт заключается в том, что широко распространенное распознавание лиц, независимо от того, контролируется ли оно государственными учреждениями или корпорациями, может привести к массовой потере конфиденциальности, повышению вероятности серьезной утечки данных и усилению существующего неравенства.

Современное состояние

Как настойчиво подчеркивают защитники, распознавание лиц во многом похоже на существующие методы биометрической идентификации, такие как отпечатки пальцев и сканирование радужной оболочки глаза. Однако есть несколько важных отличий. Во-первых, распознавание лиц является минимально инвазивным и может работать, не требуя от объекта добровольного разрешения на сканирование. Лицо представляет собой достаточно большую цель, чтобы ее можно было распознать с другой стороны улицы, но при этом достаточно различимо между людьми, чтобы использовать ее в качестве основы для идентификации. Конечно, во многих случаях мы можем даже не осознавать, что находимся под наблюдением и засекречены.

Во-вторых, распознавание лиц может основываться на существующей инфраструктуре так, как не могут другие методы. Для сбора биометрических сигналов, таких как сканирование радужной оболочки глаза и отпечатки пальцев, обычно требуется специальное оборудование. С помощью распознавания лиц, напротив, можно будет идентифицировать людей на кадрах, снятых с помощью стандартного оборудования, такого как камеры видеонаблюдения. Хотя технология будет более точной на изображениях, полученных в контролируемых условиях, результаты даже на изображениях низкого качества могут обеспечить достаточное сужение возможностей, чтобы оказаться полезными, как и одиннадцать измерений Бертильона. Камеры наблюдения стали настолько распространены, особенно в городских районах, что мы больше не подвергаем сомнению их наличие. Таким образом, эта технология потенциально может быть широко развернута почти в одночасье с минимальными предупреждениями или затратами.

В-третьих, что, возможно, наиболее важно, в отличие от отпечатков пальцев или сканирования радужной оболочки глаза, где необходимо специально получить аутентифицированное эталонное изображение, данные, необходимые для обучения системы распознавания лиц, уже широко доступны. Для первых технологий люди обычно предоставляют информацию добровольно (как в программах для доверенных путешественников, таких как US Global Entry) или вынуждены предоставлять ее (например, после ареста). Для распознавания лиц, напротив, большинство из нас уже бездумно распространило свои справочные данные по Интернету, часто в форме, которая напрямую связана с нашей личной идентифицирующей информацией.

Даже для тех, кто более осмотрительно использует социальные сети, мы, скорее всего, находимся в правительственной базе данных лиц с момента подачи заявки на получение водительских прав, которые по крайней мере 26 штатов разрешают правоохранительным органам вести поиск, согласно Джорджтаунскому центру на Конфиденциальность и технологии ». Такие изображения, особенно многочисленные фотографии в социальных сетях, предоставляют идеальные данные для обучения системам машинного обучения.

Распознавание лиц всегда будет работать лучше всего при попытке проверить личность известного человека, но его также можно использовать для попытки сопоставить неизвестного человека с большой базой данных возможностей. Возможность идентифицировать кого-либо таким образом явно зависит от того, действительно ли этот человек находится в базе данных. Менее очевидно то, что по мере увеличения количества людей в базе данных вероятность ошибок также будет увеличиваться - либо ложноотрицательных, если истинное совпадение не распознается, либо ложных срабатываний, когда человек на изображении ошибочно идентифицируется как кто-то другой - с неизбежный компромисс между этими двумя.

Производители в настоящее время заявляют о достаточно высоком уровне точности своих систем, но есть много причин, по которым такие цифры, вероятно, не заслуживают доверия. Успех будет сильно зависеть, например, от количества людей в базе данных, качества исходных и справочных изображений, условий, в которых они были получены, и так далее. Более того, как было широко задокументировано, большинство систем демонстрируют серьезные предубеждения, так что они наиболее точны при попытке идентифицировать белых людей и менее точны для других людей. Хотя идея о том, что труднее идентифицировать, на первый взгляд может показаться преимуществом с точки зрения конфиденциальности, важно помнить, что более низкая точность приведет как к ложноотрицательным, так и к ложноположительным результатам. Таким образом, существующие системы, скорее всего, будут приводить к большему количеству ошибочных идентификаций для цветных женщин и людей.

Кроме того, такие технологии, как распознавание лиц, по-прежнему могут представлять угрозу, даже если их точность намного ниже заявленной. Учитывая, как в прошлом использовались полицейские технологии, есть все основания полагать, что мы увидим развертывание таких систем в качестве механизма выбора, кого задерживать и допросить. Подобно тому, как полицейское управление Нью-Йорка в значительной степени полагалось на двусмысленную категорию тайных перемещений как на оправдание действий по остановке и обыску (которые предполагали серьезные расовые различия среди выбранных), распознавание лиц теоретически можно было бы использовать аналогичным образом - позволить определенным учреждениям оправдать поведение, которое они хотят оправдать. Другими словами, в зависимости от вашей цели низкая точность может быть скорее функцией, чем ошибкой.

Индивидуальное наблюдение

Многие из уже высказанных опасений по поводу распознавания лиц были связаны с возможным неправильным использованием со стороны государства. В конце концов, у правительств есть все необходимое для развертывания повсеместной системы распознавания лиц в качестве операционной системы - подробная информация обо всех гражданах, существующей инфраструктуре, которая может быть изменена, а также возможность формировать правовой ландшафт по мере необходимости. В самом деле, нетрудно представить постепенное движение к ситуации, которая сейчас существует в Китае, где вездесущая сеть камер и распознавания лиц используется для социального контроля, даже на уровне выявления пешеходов, которые незаконно переходят улицу.

Хотя очевидно, что существует необходимость в регулировании использования этой технологии государством, очень важно также подумать о ее использовании в частном секторе. Во всяком случае, коммерческие приложения, вероятно, будут «дружественным лицом» распознавания лиц. То есть мы встретим способы использования технологии, против которых будет трудно устоять, и которые постепенно нормализуют ее широкое распространение. Мы уже видели несколько примеров этого, таких как возможность разблокировать iPhone с помощью лица, автоматическая пометка друзей на фотографиях в Facebook и магазин Amazon Go, который автоматически взимает с людей плату за все, что они снимают с полки, без нужны кассиры.

Хотя нет никаких сомнений в том, что эта технология может улучшить нашу жизнь, в том числе способами, о которых мы даже не думали, есть также множество способов, чтобы она пошла не так. В частности, учитывая, что персональные данные стали таким важным ресурсом в современной экономике, компании неизбежно будут использовать их для сбора большего количества данных о нас и для привязки нашей онлайн-идентичности к нашей реальной деятельности.

Некоторым это может показаться спорным, учитывая, что мы уже охотно предоставляем так много нашей личной информации существующим корпорациям, включая наше местоположение в реальном времени, момент за моментом, через наши смартфоны. Однако принципиальное отличие состоит в том, что мы, по крайней мере в принципе, заключили соглашение с этими компаниями, в котором указывается, что они могут и не могут делать с этими данными. Более того, поскольку их бизнес-модель зависит от того, что мы продолжаем предоставлять им нашу информацию, они заинтересованы, по крайней мере, в попытках сохранить наше доверие, хотя часто они терпят неудачу. С другой стороны, компании, которые получают наши данные без нашего согласия, не имеют особых стимулов для адекватной защиты этих данных и, как правило, не предоставляют возможности отказаться.

Индустрия кредитного скоринга является прекрасной иллюстрацией этого. Как документировал Джош Лауэр в своей книге Creditworthy, индустрия персонального кредитного скоринга зародилась более века назад, первоначально собирая любую информацию о людях из газетных колонок сплетен и личных отчетов, а затем расширилась до создавать огромные базы данных с информацией практически обо всех. Угроза, создаваемая таким подходом, была резко раскрыта в 2017 году, когда Equifax объявила, что их система была взломана и что была раскрыта личная информация сотен миллионов людей, нарушение, за которое компания столкнулась без реальных последствий. .

Учитывая, что у нас фактически нет законного права на неприкосновенность частной жизни в общественных местах (за исключением очень ограниченных юрисдикций), мало что может помешать кредитной индустрии или другим организациям создать частную сеть наблюдения, которую можно было бы использовать для отслеживания перемещения миллионов людей в реальном времени. Хотя это может показаться надуманным, это технически осуществимо, юридически допустимо и, возможно, коммерчески жизнеспособно. В самом деле, уже существует несколько неаккуратная версия этого в виде автоматических считывателей номерных знаков, которые используются компаниями для записи и отслеживания местоположения автомобилей с течением времени.

Как только компании начнут использовать распознавание лиц для отслеживания людей, а они почти наверняка это сделают, риск серьезной утечки данных сугубо личной информации станет еще более вероятным и серьезным. Без дальнейшего регулирования компании, которые собирают и продают подробные профили людей, будут иметь все стимулы для использования этой технологии и очень мало мотивации для обеспечения ее ответственного использования.

Ложное обещание безопасности

Несмотря на озабоченность, поднятую выше, многие люди по-прежнему будут считать, что широко распространенное распознавание лиц будет чистым плюсом из-за предполагаемой выгоды с точки зрения снижения преступности или повышения общественной безопасности. Хотя, несомненно, были некоторые преимущества более широко распространенного наблюдения, стоит отметить, что распознавание лиц, в частности, может оказаться относительно легко, хотя и неудобно, обмануть. Как мы все больше понимаем, практически все системы глубокого обучения очень уязвимы для так называемых состязательных примеров. То есть можно обмануть такие системы, внося тонкие изменения во входные данные, часто незаметными для человека способами.

Хотя это проще всего продемонстрировать, изменив изображения напрямую, людям также удалось ввести в заблуждение системы распознавания изображений (например, те, которые используются в беспилотных автомобилях), например, наклеив наклейки на знаки остановки, чтобы они больше не использовались. признан таковым. В случае распознавания лиц эквивалентом может быть нанесение рисунка на лицо в виде макияжа или какого-либо другого украшения, предложенного художником Адамом Харви и другими.

Разработка средств защиты от примеров враждебности - активная область исследований, но пока кажется, что это будет продолжающаяся гонка вооружений, в которой злоумышленники, вероятно, сохранят преимущество. Конечно, даже если бы это было не так, более низкотехнологичные варианты, вероятно, останутся эффективными. В самом крайнем случае можно представить себе участие в подходе «безопасность через неизвестность», когда люди по очереди надевают маски, похожие на других людей, в попытке запутать системы наблюдения в больших масштабах.

Сохранение нашей конфиденциальности всегда будет возможным, но это, вероятно, будет сопровождаться постоянно растущими расходами, большая часть которых будет нести те, у кого меньше всего возможностей. Хотя мы можем представить себе антиутопическое будущее, в котором дизайнерские маски станут последней модной тенденцией, было бы весьма предпочтительно использовать стандартные каналы регулирования, чтобы установить разумные ограничения на такие технологии, как того требовали многие организации, в том числе Microsoft и ACLU. Технология распознавания лиц неизбежно продолжит совершенствоваться, но нам решать, как ее использовать.