LFW - Всемирный конкурс распознавания лиц. Вы лучше алгоритма?

Мы достигли нового рубежа - с точностью 99,78% в тесте производительности LFW. Этот тест является одним из самых известных и уважаемых среди разработчиков алгоритмов и решений для распознавания лиц.

LFW - это сокращение от Labeled Faces in the Wild. Это описание с официального сайта LFW. «Это база данных фотографий лиц, предназначенная для изучения проблемы безудержного распознавания лиц. Набор данных содержит более 13 000 изображений лиц, собранных из Интернета. Каждое лицо было помечено именем изображенного человека. У 1680 изображенных людей есть две или более различных фотографии в наборе данных. Единственным ограничением для этих лиц является то, что они были обнаружены детектором лиц Виолы-Джонса. Более подробную информацию можно найти в техническом отчете ниже.

Теперь существует четыре различных набора изображений LFW, включая исходные и три различных типа «выровненных» изображений. Выровненные изображения включают «воронкообразные изображения» (ICCV 2007), LFW-a, в котором используется неопубликованный метод совмещения, и «глубокие воронкообразные» изображения (NIPS 2012). Среди них LFW-a и изображения с глубокими воронками дают превосходные результаты для большинства алгоритмов проверки лица по сравнению с исходными изображениями и изображениями с воронками (ICCV 2007) ».

Различные компании, независимые команды и отдельные специалисты по обработке данных используют этот набор данных для проверки качества своих алгоритмов. Некоторые из них могут также использовать его, чтобы доказать, что их продукция стоит покупки. Но в некоторых случаях разработчики просто используют стек из нескольких NN для достижения лучших результатов. На самом деле эту комбинацию NN нельзя использовать в продукте, потому что она работает очень медленно и потребляет много вычислительной мощности. Таким образом, команда может показать невероятные результаты в тесте LFW, но точность алгоритма, который используется в продукте, который фактически доступен клиентам, может быть намного ниже.

Итак, я бы сказал, что есть очень хороший повод для гордости получить отличные результаты, если они были достигнуты с помощью нейронной сети, которая является основой конечного продукта, доступного для клиентов. В нашем случае мы использовали Faceter's NN, который используется в нашем продукте. Это означает, что наши клиенты могут рассчитывать на этот результат и ожидать, что в реальной жизни он будет таким же или очень близким к этим цифрам. Конечно, количество может быть разным. Это зависит от многих факторов: угла наклона камеры, видимости лица, освещенности, расстояния до человека и т. Д. В наших проектах PoC мы видели несколько разных результатов - в некоторых случаях точность была ниже, в некоторых - выше. Однако этот результат LFW показывает, что наш алгоритм - один из лучших в мире. Мы входим в топ-6 по этому тесту. Фактически мы делим 5-ю строчку с другой командой с таким же результатом. И мы продолжаем упорно работать над повышением точности нашего алгоритма, несмотря на это, во многих случаях 99% точности более чем достаточно.

Тем не менее, есть несколько примеров, когда алгоритмы не были полностью точными. Как насчет вас, можете ли вы узнать одного и того же человека на двух разных фотографиях? Ниже вы найдете правильные ответы.

И правильные ответы…

…

1 - да, 2 - нет, 3 - нет, 4 - нет, 5 - да, 6 - да, 7 - да

Вы узнали Николь Кидман на второй фотографии?

LFW - Всемирный конкурс распознавания лиц. Вы лучше алгоритма?

Вопросы по теме