Большое количество повседневных дел в нашей жизни требует подтверждения личности. Проверка личности обеспечивает механизм безопасности, начиная с контроля доступа к системам и заканчивая пересечением границы и банковскими транзакциями. Однако во многих действиях, требующих проверки личности, этот процесс выполняется вручную, часто медленный и требует участия оператора.

Автоматизированная система проверки личности значительно ускорит процесс и обеспечит беспрепятственную проверку безопасности во всех тех действиях, где нам необходимо подтвердить нашу личность. Один из самых простых способов сделать это - разработать систему, которая будет сопоставлять фотографии на документы с фотографиями селфи.

Предыдущие работы

В прошлом предпринимались как успешные, так и безуспешные попытки использовать автоматизированную систему проверки личности. Успешный пример - австралийский SmartGate. Это автоматизированная система самообслуживания пограничного контроля, управляемая австралийскими пограничными войсками и размещенная на иммиграционных контрольно-пропускных пунктах в залах прибытия в восьми международных аэропортах Австралии. Он использует камеру для захвата контрольного изображения и пытается сопоставить его с идентификатором человека. Также Китай внедрил такие системы на вокзалах и в аэропортах.

Хотя также были попытки сопоставить документы, удостоверяющие личность, и селфи с использованием традиционных методов компьютерного зрения, более эффективные методы основаны на глубоком обучении. Zhu et al. предложил первый подход к глубокому обучению документа для сопоставления селфи с использованием сверточных нейронных сетей.

Современная идея

В своей новой статье исследователи из Университета штата Мичиган предложили улучшенную версию своего DocFace - метод глубокого обучения для сопоставления документа и селфи.

Они показывают, что методы оптимизации на основе градиента сходятся медленно, когда многие классы имеют очень мало выборок - как в случае существующих наборов данных ID-selfie. Чтобы преодолеть этот недостаток, они предлагают метод под названием Печать динамического веса (DWI). Кроме того, они представляют новую систему распознавания для изучения унифицированных представлений от пар ID-селфи и средство сопоставления лиц с открытым исходным кодом под названием DocFace + для сопоставления ID-селфи.

Метод

При построении автоматизированной системы сопоставления ID-селфи существует большое количество проблем и ограничений. Говоря о сопоставлении ID-селфи, многие проблемы отличаются от общего распознавания лиц.

Двумя основными проблемами являются низкое качество фотографий документа (а также селфи) из-за сжатия и большой временной разрыв между временем выдачи документа и моментом проверки.

Весь метод основан на трансферном обучении. Базовая модель нейронной сети обучается на крупномасштабном наборе данных лиц (MS-Celeb 1M), а затем функции передаются в целевой домен пар ID-селфи.

Утверждая, что сходимость очень медленная и очень часто обучение может застревать в локальных минимумах при работе со многими классами, имеющими очень мало выборок, исследователи предлагают использовать функцию потерь Additive Margin Softmax (AM-Softmax). наряду с новым методом оптимизации, который они называют Dynamic Weight Imprinting (DWI).

Печать динамического веса

Поскольку стохастический градиентный спуск обновляет сеть с помощью мини-пакетов, в случае двухвыстрелов (например, при сопоставлении ID-селфи) каждый вектор весовых коэффициентов будет получать сигналы только дважды за эпоху. Эти редкие сигналы притяжения мало влияют на веса классификатора. Чтобы преодолеть эту проблему, они предлагают новый метод оптимизации, идея которого состоит в том, чтобы обновить веса на основе характеристик выборки и, таким образом, избежать недостаточного соответствия весов классификатора и ускорить сходимость.

По сравнению со стохастическим спуском градиента и другими методами оптимизации на основе градиента, предлагаемый DWI обновляет веса только на основе подлинных выборок. Он обновляет только веса классов, которые присутствуют в мини-пакете, и хорошо работает с обширными наборами данных, где весовая матрица всех классов слишком велика для загрузки, и только подмножество весов может быть выбрано для обучения.

Исследователи обучили популярную архитектуру Face-ResNet, используя стохастический градиентный спуск и потери AM-Softmax. Затем они настраивают модель в наборе данных ID-selfie, связывая предложенный метод оптимизации Dynamic Weight Imprinting с Additive Margin Softmax. Наконец, пара одноуровневых сетей обучается изучению специфичных для предметной области особенностей идентификаторов и селфи с общими высокоуровневыми параметрами.

Полученные результаты

Предлагаемый метод согласования ID-селфи дает отличный результат: истинная скорость приема TAR составляет 97,51 ± 0,40%. Авторы сообщают, что их подход с использованием набора данных MS-Celeb-1M и функции потерь AM-Softmax обеспечивает точность 99,67% на стандартном протоколе проверки LFW и коэффициент проверки (VR) 99,60% при скорости ложного принятия (FAR) 0,1% по протоколу BLUFR.

Сравнение с другими современными

Этот подход сравнивался с другими современными общими методами сопоставления лиц, поскольку не существует существующих общедоступных методов сопоставления идентификаторов и селфи. Сравнение с этими методами дано относительно TAR - истинной скорости принятия и FAR - ложной скорости принятия и показано в таблицах ниже.

Заключение

Предлагаемый метод DocFace + для сопоставления ID-селфи показывает потенциал трансферного обучения, особенно в задачах, где недостаточно данных. Предлагаемый метод обеспечивает высокую точность сопоставления селфи с идентификатором и может быть использован в системах проверки личности. Кроме того, предлагаемый новый метод оптимизации - Dynamic Weight Imprinting демонстрирует улучшенную сходимость и лучшую производительность обобщения и представляет собой значительный вклад в область машинного обучения.

Получайте лучшие предложения по программному обеспечению прямо в свой почтовый ящик

Первоначально опубликовано на сайте neurohive.io 24 сентября 2018 г.