АВТОНОМНАЯ ПРОВЕРКА ПОДПИСИ……

Аутентификация человека с помощью автономных биометрических исследований рукописной подписи расширяется, особенно в последнее десятилетие. Тот факт, что подпись широко используется в качестве средства личной проверки, подчеркивает необходимость в системе автоматической проверки из-за нежелательного побочного эффекта, заключающегося в том, что ею легко злоупотребляют те, кто пытается симулировать личность или намерения человека. За последние несколько десятилетий в области проверки подписи была проделана большая работа. Проверка может быть выполнена как в автономном режиме, так и в режиме онлайн в зависимости от приложения. Онлайн-системы используют динамическую информацию о подписи, полученную в момент создания подписи. Автономные системы работают на отсканированном изображении подписи. Процесс проверки автономной собственноручной подписи — нетривиальная задача, потому что человек редко подписывает одну и ту же подпись всякий раз, когда подписывает, что называется изменчивостью внутри пользователя.

В этом проекте мы внедрили автономную систему обнаружения сигнатур. Перед реализацией алгоритма необходима предварительная обработка отсканированного изображения, чтобы изолировать часть подписи и удалить любой присутствующий шум. Целью этого проекта является предложение вектора признаков автономной рукописной подписи с использованием эффективного алгоритма в качестве сильного извлечения признаков, а именно градиента ориентации гистограммы (HOG), для передачи в искусственную нейронную сеть для операции распознавания. Был проведен эксперимент для оценки точности и производительности предложенного алгоритма с использованием локальной базы данных, которая содержит более 48 подлинных и 48 поддельных образцов подписей, взятых у 4 человек.

  1. Предварительная обработка изображений и извлечение признаков...

Мы подходим к проблеме в два этапа. Первоначально отсканированное изображение подписи предварительно обрабатывается, чтобы его можно было использовать для создания модели. Затем предварительно обработанное изображение используется для создания модели, которая может отличать поддельные подписи от точных, используя подход ANN.

2. Предварительная обработка..

Подпись сначала фиксируется и преобразуется в формат, который может быть обработан компьютером. Теперь он готов к предварительной обработке. На этапе предварительной обработки RGB-изображение подписи преобразуется в оттенки серого, а затем в двоичное изображение. Этап предварительной обработки включает в себя: шумоподавление, инверсию цвета, фильтрацию и бинаризацию.

3. Шумоподавление..

Одной из фундаментальных проблем в области обработки изображений и компьютерного зрения является шумоподавление изображения, основной целью которого является оценка исходного изображения путем подавления шума из загрязненной шумом версии изображения. Шум изображения может быть вызван различными внутренними (т. е. датчиком) и внешними (т. е. окружающей средой) условиями, которых часто невозможно избежать в практических ситуациях. Таким образом, шумоподавление изображения играет важную роль в широком спектре приложений, таких как восстановление изображений, визуальное отслеживание, регистрация изображений, сегментация изображений и классификация изображений, где получение исходного содержимого изображения имеет решающее значение для высокой производительности. Хотя было предложено много алгоритмов для устранения шума изображения, проблема подавления шума изображения остается открытой проблемой, особенно в ситуациях, когда изображения получены в плохих условиях, когда уровень шума очень высок. Альтернативный подход к проблеме шумоподавления изображения, основанный на дискретизации Монте-Карло с помощью цепи Маркова. Сформулировав проблему как задачу байесовской оптимизации и применив непараметрическую стохастическую стратегию для решения этой проблемы, такая стратегия марковской цепи Монте-Карло (MCMCD) динамически адаптируется к базовому изображению и статистике шума гибким образом, чтобы обеспечить высокую производительность шумоподавления. при сохранении относительно низкой вычислительной сложности.

4. Инверсия цвета..

Истинное цветное изображение RGB преобразуется в изображение интенсивности в оттенках серого путем исключения информации об оттенке и насыщенности при сохранении яркости.

5. Изображения в оттенках серого..

Изображение в оттенках серого представляет собой матрицу данных, значения которой представляют интенсивности в некотором диапазоне, где каждый элемент матрицы соответствует одному пикселю изображения. Это просто тот, в котором единственными цветами являются оттенки серого. Причина отличия таких изображений от любого другого вида цветного изображения заключается в том, что для каждого пикселя необходимо предоставить меньше информации. На самом деле «серый» цвет — это цвет, в котором красный, зеленый и синий компоненты имеют одинаковую интенсивность в пространстве RGB, поэтому необходимо указать только одно значение интенсивности для каждого пикселя, в отличие от трех значений интенсивности, необходимых для укажите каждый пиксель в полноцветном изображении. Часто интенсивность оттенков серого сохраняется в виде 8-битного целого числа, что дает 256 возможных различных оттенков серого от черного до белого. Если уровни равномерно распределены, то разница между последовательными уровнями серого значительно лучше, чем разрешающая способность уровней серого человеческого глаза. Изображения в градациях серого очень распространены, отчасти потому, что большая часть современного оборудования для отображения и захвата изображений может поддерживать только 8-битные изображения. Кроме того, для многих задач изображений в градациях серого вполне достаточно, поэтому нет необходимости использовать более сложные и трудные в обработке цветные изображения.

6. Фильтрация изображений и бинаризация..

Любое изображение при передискретизации фильтруется низкочастотным КИХ-фильтром. Это сделано для того, чтобы избежать алиасинга. Это наложение происходит из-за выборки данных со скоростью, меньшей, чем в два раза превышающей наибольшую частотную составляющую данных. Таким образом, фильтр нижних частот удалит высокочастотные компоненты изображения. И для этого использовал фильтр. Теперь изображение в градациях серого сегментируется, чтобы получить бинарное изображение объектов. В бинарном изображении каждый пиксель принимает одно из двух дискретных значений: 1 или 0. Бинарное изображение хранится в виде логического массива.

7. Извлечение функций..

Мы экспериментировали с двумя отдельными функциями: гистограммой ориентированных градиентов (HOG) относительно доминирующей ориентации и локальными бинарными паттернами.

8. Гистограмма ориентированных градиентов (HOG)..

Градиент ориентации гистограммы (HOG) используется для представления формы объекта, который был представлен Далалом и Триггсом на конференции CVPR в 2005 году. HOG в основном используется для детектора человека, что означает гистограммы ориентированных градиентов. В этом исследовании HOG был принят в качестве метода извлечения признаков для распознавания и аутентификации изображения подписи. Теоретически метод дескриптора HOG подсчитывает случаи ориентации градиента в локализованных частях изображения или интересующей области (ROI). Проиллюстрированная базовая реализация дескриптора HOG выглядит следующим образом: во-первых, изображение делится на небольшие соединенные области (ячейки) и для каждой области вычисляется гистограмма направлений градиента или ориентаций краев для пикселей внутри ячейки, затем , используя полученную ориентацию градиента. После этого каждая ячейка дискретизируется в угловые интервалы, затем каждый пиксель ячейки вносит взвешенный градиент в соответствующий угловой интервал, затем корректирующие ячейки группируются в блоки в пространственной области. Это формирует основу для группировки и нормализации гистограмм, наконец, нормализованная группа гистограмм представляет собой блочную гистограмму, а набор этих блочных гистограмм представляет собой дескриптор. Другими словами, для вычисления дескриптора HOG требуются следующие основные параметры конфигурации, маски для вычисления производных и градиентов, геометрия разбиения изображения на ячейки и группировки ячеек в блок, параметры перекрытия блоков и нормализации. В этой статье HOG характеризуется размером блока [22x22] пикселей, размером ячейки 128 с 9-биновой гистограммой на ячейку. Соответственно, общая длина вектора признаков составляет 216, используемая для представления каждой выборки изображения подписи. На рисунке 4 показаны две автономные рукописные подписи с различными размерами ячеек, которые были реализованы в этом исследовании и рассматривались для разработки реализации HOG для автономной подписи. Ясно, что при малом размере ячейки количество нанесенных на график градиентов и направлений значительно яснее, чем при большом размере ячейки. Постепенно, увеличивая размер ячейки параметра HOG, направления и градиент будут уменьшаться.

9. Вычисление градиента..

Первым шагом расчета во многих детекторах признаков при предварительной обработке изображения является обеспечение нормированных значений цвета и гаммы. Однако, как отмечают Далал и Триггс, этот шаг можно опустить при вычислении дескриптора HOG, поскольку последующая нормализация дескриптора по существу дает тот же результат. Таким образом, предварительная обработка изображения мало влияет на производительность. Вместо этого первым шагом расчета является вычисление значений градиента. Наиболее распространенным методом является применение одномерной центрированной точечной маски дискретной производной в одном или обоих направлениях по горизонтали и по вертикали. В частности, этот метод требует фильтрации данных цвета или интенсивности изображения с помощью следующих ядер фильтров: в изображениях.

10. Биннинг по ориентации..

Вторым шагом расчета является создание гистограмм ячеек. Каждый пиксель в ячейке отдает взвешенный голос за канал гистограммы на основе ориентации на основе значений, найденных при вычислении градиента. Сами ячейки могут иметь прямоугольную или радиальную форму, а каналы гистограммы равномерно распределены в пределах от 0 до 180 градусов или от 0 до 360 градусов, в зависимости от того, является ли градиент «беззнаковым» или «знаковым». Далал и Триггс обнаружили, что градиенты без знака, используемые в сочетании с 9 каналами гистограммы, показали лучшие результаты в их экспериментах по обнаружению людей. Что касается веса голоса, вклад пикселей может быть либо самой величиной градиента, либо некоторой функцией величины. В тестах сама величина градиента обычно дает наилучшие результаты.

11. Блоки дескрипторов..

Чтобы учесть изменения в освещении и контрасте, интенсивность градиента должна быть локально нормализована, что требует группировки ячеек в более крупные пространственно связанные блоки. Затем дескриптор HOG является конкатенированным вектором компонентов нормализованных гистограмм ячеек из всех областей блока. Эти блоки обычно перекрываются, а это означает, что каждая ячейка вносит более одного вклада в окончательный дескриптор. Существуют две основные геометрии блоков: прямоугольные блоки R-HOG и круглые блоки C-HOG. Блоки RHOG обычно представляют собой квадратные сетки, представленные тремя параметрами: количеством ячеек в блоке, количеством пикселей в ячейке и количеством каналов в гистограмме ячейки. В эксперименте Далала и Триггса по обнаружению человека оптимальными параметрами оказались четыре ячейки 8x8 пикселей на блок (16x16 пикселей на блок) с 9 каналами гистограммы. Более того, они обнаружили, что небольшое улучшение производительности можно получить, применяя пространственное окно Гаусса в каждом блоке перед табулированием голосов гистограммы, чтобы меньше взвешивать пиксели вокруг края блоков. Блоки R-HOG очень похожи на дескрипторы масштабно-инвариантного преобразования признаков (SIFT); однако, несмотря на схожее формирование, блоки R-HOG вычисляются в плотных сетках в каком-то едином масштабе без выравнивания ориентации, тогда как дескрипторы SIFT обычно вычисляются в разреженных, не зависящих от масштаба ключевых точках изображения и поворачиваются для выравнивания ориентации. Кроме того, блоки R-HOG используются вместе для кодирования информации о пространственной форме, в то время как дескрипторы SIFT используются по отдельности.

Круглые блоки HOG (C-HOG) можно найти в двух вариантах: с одной центральной ячейкой и с угловой разделенной центральной ячейкой. Кроме того, эти блоки C-HOG можно описать четырьмя параметрами: количеством угловых и радиальных бинов, радиусом центрального бина и коэффициентом расширения для радиуса дополнительных радиальных бинов. Далал и Триггс обнаружили, что два основных варианта обеспечивают одинаковую производительность, а два радиальных бина с четырьмя угловыми бинами, центральный радиус 4 пикселя и коэффициент расширения 2 обеспечивают наилучшую производительность в их экспериментах (для достижения хорошей производительности, наконец, используйте эту конфигурацию). Кроме того, взвешивание по Гауссу не дает никаких преимуществ при использовании вместе с блоками C-HOG. Блоки C-HOG кажутся похожими на дескрипторы контекста формы, но сильно отличаются тем, что блоки C-HOG содержат ячейки с несколькими каналами ориентации, в то время как контексты формы используют в своей формулировке только один счетчик наличия ребер.

12. Распознавание объектов..

Дескрипторы HOG можно использовать для распознавания объектов, предоставляя их в качестве признаков алгоритму машинного обучения. Далал и Триггс использовали дескрипторы HOG в качестве признаков в машине опорных векторов (SVM)[9]; однако дескрипторы HOG не привязаны к конкретному алгоритму машинного обучения. Обратите внимание, что в то время как сложные функции дают больше информации, более простые функции, такие как ориентация градиента, более устойчивы к обычным вариациям, обнаруженным в сигнатуре.

13. Искусственная нейронная сеть..

Искусственные нейронные сети (ИНС) или коннекционистские системы — это вычислительные системы, смутно вдохновленные биологическими нейронными сетями, составляющими мозг животных. Сама нейронная сеть — это не алгоритм, а скорее основа для множества различных алгоритмов машинного обучения, которые работают вместе и обрабатывают сложные входные данные. Такие системы «учатся» выполнять задачи, рассматривая примеры, как правило, без программирования какой-либо задачи — конкретных правил. Например, при распознавании изображений они могут научиться идентифицировать изображения, содержащие кошек, анализируя примеры изображений, которые были вручную помечены как «кошка» или «без кошки», и используя результаты для идентификации кошек на других изображениях. Они делают это без каких-либо предварительных знаний о кошках, например, о том, что у них есть шерсть, хвосты, усы и кошачьи морды. Вместо этого они автоматически генерируют характеристики из учебного материала, который они обрабатывают.

14. Базовая структура ИНС..

Идея ИНС основана на вере в то, что работу человеческого мозга, создавая правильные соединения, можно имитировать, используя кремний и провода в качестве живых нейронов и дендритов. Человеческий мозг состоит из 86 миллиардов нервных клеток, называемых нейронами. Они связаны с другими тысячами клеток Аксонами. Раздражители из внешней среды или входы от органов чувств воспринимаются дендритами. Эти входы создают электрические импульсы, которые быстро проходят через нейронную сеть. Затем нейрон может отправить сообщение другому нейрону для решения проблемы или не отправлять его дальше. ИНС состоят из множества узлов, которые имитируют биологические нейроны человеческого мозга. Нейроны связаны связями и взаимодействуют друг с другом. Узлы могут принимать входные данные и выполнять с ними простые операции. Результат этих операций передается другим нейронам. Выход в каждом узле называется его активацией или значением узла.

ИНС FeedForward…

В этой ИНС информационный поток является однонаправленным. Блок отправляет информацию другому блоку, от которого он не получает никакой информации. Петли обратной связи отсутствуют. Они используются для генерации/распознавания/классификации образов. Они имеют фиксированные входы и выходы.

Обратная связь ANN..

Здесь разрешены петли обратной связи. Они используются в запоминающих устройствах с адресацией по содержанию.

15. Работа ИНС..

На показанных диаграммах топологии каждая стрелка представляет собой соединение между двумя нейронами и указывает путь для потока информации. Каждое соединение имеет вес, целое число, которое управляет сигналом между двумя нейронами.

16. Машинное обучение в ИНС..

ИНС способны к обучению, и их необходимо обучать. Есть несколько стратегий обучения —

Контролируемое обучение — — в нем участвует учитель, который является ученым, а не самой ИНС. Например, учитель передает некоторые примерные данные, ответы на которые учитель уже знает.

Неконтролируемое обучение — — требуется, когда нет примера набора данных с известными ответами. Например, поиск скрытого шаблона.

Обучение с подкреплением — — эта стратегия основана на наблюдении. ANN принимает решение, наблюдая за окружающей средой.

17. Алгоритм обратного распространения...

Это алгоритм обучения или обучения. Оно учится на примере. Если вы отправляете алгоритму пример того, что вы хотите, чтобы сеть делала, он меняет веса сети, чтобы она могла выдавать желаемый результат для определенного ввода по завершении обучения.

18. Байесовские сети (БС)..

Это графические структуры, используемые для представления вероятностных отношений между набором случайных величин. Байесовские сети также называют сетями доверия или байесовскими сетями. Причина BN в неопределенном домене.

В этих сетях каждый узел представляет собой случайную величину с определенными предложениями. Например, в области медицинской диагностики узел Рак представляет предположение о том, что у пациента рак.

Ребра, соединяющие узлы, представляют собой вероятностные зависимости между этими случайными величинами. Если из двух узлов один влияет на другой, то они должны быть напрямую связаны в направлениях воздействия. Сила взаимосвязи между переменными количественно определяется вероятностью, связанной с каждым узлом.

19. Приложения нейронных сетей..

Они могут выполнять задачи, простые для человека, но сложные для машины.

Аэрокосмическая промышленность — Самолеты с автопилотом, обнаружение неисправностей самолетов.  Автомобилестроение – автомобильные системы наведения. 

Военные — ориентация и управление оружием, отслеживание целей, распознавание объектов, распознавание лиц, идентификация сигнала / изображения. 

Электроника — прогнозирование последовательности кодов, компоновка микросхемы IC, анализ отказа микросхемы, машинное зрение, синтез голоса. 

Финансы — оценка недвижимости, кредитный консультант, проверка ипотеки, рейтинг корпоративных облигаций, программа торговли портфелем, корпоративный финансовый анализ, прогноз стоимости валюты, считыватели документов, оценщики кредитных заявок.

20. Обучение ИНС..

Искусственная нейронная сеть или ANN[7] напоминает человеческий мозг в обучении посредством обучения и хранения данных.

ИНС создается и обучается с помощью заданного шаблона обучения входных/целевых данных. В процессе обучения выходные данные нейронной сети сравниваются с целевым значением, и выполняется коррекция веса сети с помощью алгоритма обучения таким образом, чтобы минимизировать функцию ошибки между двумя значениями.

Среднеквадратическая ошибка (MSE) — это часто используемая функция ошибки, которая пытается минимизировать среднюю ошибку между выходом сети и целевым значением.

Двенадцать точных подписей и двенадцать поддельных подписей обучают сеть, и их было достаточно, чтобы дать очень хорошие результаты при проверке.

В таблице ниже содержится вся информация, связанная с дизайном нейронной сети. Для обучения сети используются как оригинальные, так и поддельные подписи. Также доступны тестовые подписи.

ЭКСПЕРИМЕНТ И РЕЗУЛЬТАТЫ..

  1. ЭКСПЕРИМЕНТ.. —

Правило эксперимента применяется к шаблону подписи в автономном режиме, чтобы измерить точность проверки предлагаемого метода проверки подписи в автономном режиме. Эксперимент реализуется в соответствии со следующими этапами:

  1. По сигнатурам из локальной базы данных строится обучающая матрица. Обучающая матрица состоит из подписей от 4-х лиц, для каждого человека получается 12 подлинных образцов и 12 поддельных образцов (из них пять случайных подделанных образцов, а остальные - умело подделанные образцы).

2. Оценка результата, полученного с помощью ИНС, выполняется путем извлечения коэффициента ложного принятия (FAR) и коэффициента ложного отклонения (FRR) для каждого человека отдельно. Матрица тестирования строится аналогично тому, как строилась матрица обучения.

3. В обучающей цели (назначении) ИНС первым 10 сигнатурным образцам обучаемой матрицы присваивается знак +1, и, наоборот, -1 присваивается вторым 10 сигнатурным образцам обучающей матрицы для маркировки и обучения ИНС говорит о том, что первые 10 являются подлинными образцами, а вторые 10 — поддельными образцами.

4. Используемый порог (ноль).

5. FRR вычисляется путем оценки результатов первых 10 образцов. Если какой-либо признак первых 10 отсчетов меньше порога, счетчик False Rejection (FR) будет увеличен на единицу (FR = FR + 1), так как они должны быть приняты (знаки больше порога), но они ошибочно отклоняются проверочной системой. С другой стороны, если результаты вторых 10 выборок имеют знаки больше порога, они рассматриваются как False Accept (FA) и счетчик увеличивается на единицу (FA=FA+1).

FAR и FRR вычисляются как в (3) и (4) соответственно:

6. Точность каждого пользователя вычисляется с помощью (5):

2. Результаты..

Что касается результата эксперимента, в таблице 1 приведены FAR, FRR и их среднее значение для предлагаемого алгоритма распознавания:

Чтобы закрепить результаты этой статьи, было проведено сравнительное исследование с набором контрольных работ, опубликованных недавно, поскольку в таблице 2 сравниваются результаты предложенной схемы с некоторыми из существующих алгоритмов распознавания подписи.

Стоит отметить, что основным вкладом в эту статью является использование HOG, который был обнаружен, поскольку он весьма полезен для извлечения биометрических признаков в автономном режиме за счет получения многообещающей скорости распознавания в будущем, поскольку было подтверждено, что результат этого исследования превосходит современное офлайн-распознавание подписи

Однако установка малых параметров HOG (размер ячейки, размер блока, бин) увеличит длину вектора признаков представленного образца подписи, что вызовет большие временные затраты классификатора и приведет к низкой скорости обработки распознавания. По этой причине соблюдение баланса в выборе параметров ГОГ (не столь малых и не столь больших) приведет к оптимальным и многообещающим результатам с точки зрения как точности распознавания, так и скорости обработки.