Как извлечь номера изображений с помощью IBMCloud Visual Recognition Text?

Я следую этому руководству: https://cloud.ibm.com/docs/services/visual-recognition?topic=visual-recognition-tutorial-recognize-text&locale=en-US#pr-ximos-passos

Моя цель - прочитать документ и составить оглавление. Содержимое имеет тип KEY-VALUE, например "VALUE 10.00". Я могу извлечь текст изображения, но не могу извлечь числа.

  • Контекстуализация проблемы:

я использую это изображение

введите здесь описание изображения

Значения, которые необходимо извлечь:

DATA                        13/06/2016
AGENCIA/CASH                0180/2009
VALOR DEPOSITO EM DINHEIRO  50.00

Но когда я использую следующий вызов curl для службы визуального распознавания:

curl -u "apikey:{API_KEY}" --form "[email protected]" "https://gateway.watsonplatform.net/visual-recognition/api/v3/recognize_text?version=2018-03-19" -k

Результат (штука):

        "text": "data gigolo hora\nman/em 251\nnumero envelope 689 574\nvalor depusitd eh 4\ncpf no defusnantez 614 220\ndata lananzmnz",
        "words": [
            {
                "word": "data",
                "location": {
                    "height": 18,
                    "width": 40,
                    "left": 13,
                    "top": 10
                },
                "score": 0.6098,
                "line_number": 0
            },
            {
                "word": "gigolo",
                "location": {
                    "height": 43,
                    "width": 57,
                    "left": 146,
                    "top": 0
                },
                "score": 0.4283,
                "line_number": 0
            },
            {
                "word": "hora",
                "location": {
                    "height": 18,
                    "width": 39,
                    "left": 249,
                    "top": 11
                },
                "score": 0.6533,
                "line_number": 0
            },
            {
                "word": "man/em",
                "location": {
                    "height": 17,
                    "width": 72,
                    "left": 127,
                    "top": 35
                },
                "score": 0.8187,
                "line_number": 1
            },
            {
                "word": "251",
                "location": {
                    "height": 21,
                    "width": 30,
                    "left": 294,
                    "top": 33
                },
                "score": 0.9881,
                "line_number": 1
            },
            {
                "word": "numero",
                "location": {
                    "height": 21,
                    "width": 54,
                    "left": 12,
                    "top": 52
                },
                "score": 0.9116,
                "line_number": 2
            },

Обратите внимание, что некоторые слова извлекаются хорошо, а числа — нет. Моя основная цель — извлечь денежные значения и даты.

Чтобы создать свою таблицу, я могу использовать свойство "height", чтобы узнать, какое у вас соответствующее числовое значение.

Итак, как мне извлечь числа?

PS.: Это португальский (BR) документ.


person Augusto    schedule 17.07.2019    source источник


Ответы (1)


Благодарим вас за интерес к сервису... однако, в том виде, в каком он доступен сегодня, эта бета-версия сервиса в основном обучена словарю английского языка. Хотя он может распознавать короткие числовые строки, он не особенно хорошо справляется с такими задачами, как чтение произвольных чисел, таких как цены, серийные номера или номерные знаки. Также, вероятно, не будут найдены слова на бразильском португальском языке.

person Matt Hill    schedule 18.07.2019
comment
Есть ли способ обучить или улучшить распознавание этих типов чисел? - person Augusto; 18.07.2019
comment
к сожалению, нет, эта часть сервиса не обучаема. Однако вы можете обучить пользовательский классификатор создавать метки, применимые ко всему изображению, например, чтобы отличать печатные квитанции от рукописных. - person Matt Hill; 19.07.2019