Поиск специальной информации

Я хочу извлечь общий счет из квитанций изображения. Я мог бы извлечь все данные, присутствующие в изображении, но теперь я столкнулся с проблемой извлечения только той информации, которая мне нужна.

Это образ, который у меня есть.

введите здесь описание изображения

Я вставляю извлеченную информацию из изображения

m cm lnnk 3mm: :33; no 1 z m
x Visut all! ms“; (or nulnunn mfn an an: nan.



Sub Iota] 19.56
TOTAL 19.56
VISA 1956
Fun 19.56
D!!! You Know 0



For ureat-tastlru dessens under 200
cahries, try our Triple Berry Frozen
Yogurt Sunda: a dish of Frozen Yogurt.
or a Vanma rozen Vugurt Done.

Из этих данных я просто хочу извлечь общий счет. Чтобы получить это, я обнаружил, что могу использовать специальную нормализацию (Adhoc-извлечение). Может ли кто-нибудь дать какие-либо сведения о поиске Adhoc. Если есть какой-либо другой вариант извлечения данных из изображения, позвольте мне сделать это. Я использую tesseract для извлечения этой информации. Иногда это не дает надлежащего результата. Мне не помешала бы помощь в импровизации вывода, выдаваемого тессерактом.


person Phaneeth    schedule 15.08.2017    source источник
comment
Можете ли вы добавить немного больше информации? Желаемый результат 19,56? Это должно работать на нескольких счетах?   -  person shiri    schedule 02.10.2017


Ответы (1)


Зачем в этом случае нужен поиск ad hoc? Поскольку вы получаете результат OCR из квитанции, вы можете просто выполнить обычный текстовый поиск элемента, отображаемого рядом с «ИТОГО».

Существуют алгоритмы поиска текста по изображению, но это кажется излишним для такого простого приложения, если только для этого нет веских причин.

person shiri    schedule 02.10.2017