Распознавание лиц для цифрового KYC
Мировой спрос на цифровые услуги вызвал потребность в проверке цифровой личности. Компании, которые доверяют своим пользователям (или водителям) ценные вещи - банковские счета, мобильные SIM-карты, кредитные карты, мотоциклы - часто проводят проверку «Знай своего клиента» (KYC), чтобы соответствовать требованиям или предотвратить мошенничество.

В 2020 году пандемия коронавируса ускорила это, и большинство проверок KYC переводятся в онлайн, поскольку компании пытаются оцифровать свои повседневные операции. Рост искусственного интеллекта и больших данных позволил использовать инновационные подходы к цифровому KYC, включая использование распознавания лиц (FR). Однако в последнее время распознавание лиц стало предметом пристального внимания из-за его использования правительствами и полицейскими управлениями, а также из-за распространенного расового алгоритмического предубеждения, приводящего к более низкой точности для черных лиц / лиц с высоким содержанием меланина.

Процесс разработки распознавания лиц включает в себя сбор данных и обучающие модели целевых идентификационных данных. Результаты отражают наборы данных, использованные для их обучения. Но большинство доступных моделей обучаются в основном на лицах кавказцев, поэтому алгоритмическая точность, как правило, выше на лицах кавказцев по сравнению с лицами африканцев и других лиц с высоким содержанием меланина.

Смещение в цепочке обработки
Смещение влияет на всю цепочку обработки изображения от датчиков камеры телефона до программного обеспечения для определения положения лица и выравнивания и алгоритмов распознавания.

Настройки экспозиции сенсора камеры определяются следующим образом:

  • «Диафрагма» (количество света, проходящего через линзу)
  • Чувствительность ISO (светочувствительность камеры) и
  • "Выдержка" (как долго свет может попадать на сенсор камеры)

Большинство производителей устройств устанавливают их по умолчанию, чтобы делать лучшие снимки на светлой коже. Стандарты коммерческого изображения также предвзято относятся к тому, что более темные лица ограничиваются меньшей частью поддерживаемого динамического диапазона.

И проблема набора данных снова появляется при обнаружении и распознавании положения лица - геометрические черты лица, полученные с помощью моделей обнаружения лиц, как правило, смещены по сравнению с лицами африканцев и лиц с высоким содержанием меланина из-за отсутствия разнообразия лиц в широко используемых наборах данных для обучения и тестирования. Широко используемые наборы данных эталонного тестирования, такие как Microsoft Celeb-1M и академический набор данных Labeled Faces in the Wild (LFW), используются исследователями для оценки точности модели, несмотря на присущую им предвзятость - у Celeb-1M примерно 14,5% лиц африканцев и афроамериканцев, в то время как LFW оценивается как 77,5% мужчин и 83,5% белых.

Предвзятость среди известных поставщиков услуг распознавания лиц
Учитывая предвзятость во всей цепочке, неудивительно, что статистика показывает огромную разницу между точностью распознавания темных и светлых лиц у некоторых ведущих поставщиков FR. И это предубеждение усугубляется, если принять во внимание пол. Исследование гендерной классификации, проведенное Gendershades в 2018 году, показало, что ведущие провайдеры FR, такие как Face ++, Microsoft и IBM, менее точно отображали темные лица по сравнению с более светлыми. Худшие результаты были для изображений более темных женщин, где между ними и более светлыми лицами мужчин был разрыв в расовой точности 21-34% у трех основных поставщиков FR.

Хотя со времени первоначального исследования, особенно Microsoft, были внесены улучшения, более свежий обзор Gendershades по гендерной классификации в 2019 году, который включал больше поставщиков FR, показал, что самый большой разрыв в точности со стороны основных поставщиков по-прежнему составляет 31,4%.

Учитывая, что системы распознавания лиц используются для принятия столь важных решений, как правоохранительные органы, эти предубеждения могут иметь ужасные последствия, как показывает недавний неправомерный арест чернокожего американца из-за алгоритма распознавания лиц.

Устранение основной проблемы
Smile Identity работает над устранением этой предвзятости. Мы предоставляем услуги распознавания лиц для доступа к финансовым услугам без наблюдения и согласия. Наши партнеры работают с нами, чтобы ежедневно собирать настоящие африканские селфи, сделанные в различных сферах и деятельности, что делает эти данные уникальными и репрезентативными для повседневной жизни в Африке и для множества людей с высоким уровнем меланина на лицах. Располагая этими уникальными данными, Smile использует методы предварительной обработки, адаптированные для африканских лиц, и оптимизированные методы глубокого обучения с контролируемым просмотром человеком, чтобы улучшить характеристики современных моделей на лицах с высоким содержанием меланина. Недавние эксперименты, проведенные в Smile Identity с использованием одного из ведущих методов глубокого обучения на нашем собственном наборе данных, показали значительное улучшение объективной точности. Алгоритм Smile уменьшил разрыв модели в точности темных лиц существенно, с увеличением точности с 88,0% до 98,9%, что сопровождалось лишь незначительной (0,5%) потерей точности для смешанных лиц LFW. Сейчас мы работаем над публикацией наших результатов в рамках рецензируемого исследования.

Технологические гиганты придерживаются философии отсутствия слежки
От проверки доступа к KYC / борьбе с мошенничеством до борьбы с торговлей людьми и отслеживания посещаемости. Распознавание лиц становится обычным техническим компонентом для предприятий и правительств во всем мире. глобус. Но с самого начала Smile Identity приняла решение не создавать сценарии для использования в правоохранительных органах или слежке. Наша технология предназначена для фронтальных изображений, и наши политики требуют, чтобы наши партнеры получали согласие пользователей, прежде чем делать снимки. Крупные компании, такие как Amazon, IBM и Microsoft, только недавно адаптировали эту философию, ожидая принятия федерального законодательства США.

Почему мы это делаем
Хотя устранение предвзятости FR - обычно сложная проблема, решение этой проблемы для африканцев и других лиц с высоким уровнем меланина Smile Identity раскроет большой потенциал в Африке и за ее пределами. И как африканский инженер искусственного интеллекта, работающий с Smile Identity над устранением предвзятости в KYC на основе распознавания лиц, каждый день становится особенным, когда вы вспоминаете, что ваша работа является преимуществом для вашего континента.