Как извлечь номера изображений с помощью IBMCloud Visual Recognition Text?

Я следую этому руководству: https://cloud.ibm.com/docs/services/visual-recognition?topic=visual-recognition-tutorial-recognize-text&locale=en-US#pr-ximos-passos

Моя цель - прочитать документ и составить оглавление. Содержимое имеет тип KEY-VALUE, например "VALUE 10.00". Я могу извлечь текст изображения, но не могу извлечь числа.

Контекстуализация проблемы:

я использую это изображение

Значения, которые необходимо извлечь:

DATA                        13/06/2016
AGENCIA/CASH                0180/2009
VALOR DEPOSITO EM DINHEIRO  50.00

Но когда я использую следующий вызов curl для службы визуального распознавания:

curl -u "apikey:{API_KEY}" --form "[email protected]" "https://gateway.watsonplatform.net/visual-recognition/api/v3/recognize_text?version=2018-03-19" -k

Результат (штука):

        "text": "data gigolo hora\nman/em 251\nnumero envelope 689 574\nvalor depusitd eh 4\ncpf no defusnantez 614 220\ndata lananzmnz",
        "words": [
            {
                "word": "data",
                "location": {
                    "height": 18,
                    "width": 40,
                    "left": 13,
                    "top": 10
                },
                "score": 0.6098,
                "line_number": 0
            },
            {
                "word": "gigolo",
                "location": {
                    "height": 43,
                    "width": 57,
                    "left": 146,
                    "top": 0
                },
                "score": 0.4283,
                "line_number": 0
            },
            {
                "word": "hora",
                "location": {
                    "height": 18,
                    "width": 39,
                    "left": 249,
                    "top": 11
                },
                "score": 0.6533,
                "line_number": 0
            },
            {
                "word": "man/em",
                "location": {
                    "height": 17,
                    "width": 72,
                    "left": 127,
                    "top": 35
                },
                "score": 0.8187,
                "line_number": 1
            },
            {
                "word": "251",
                "location": {
                    "height": 21,
                    "width": 30,
                    "left": 294,
                    "top": 33
                },
                "score": 0.9881,
                "line_number": 1
            },
            {
                "word": "numero",
                "location": {
                    "height": 21,
                    "width": 54,
                    "left": 12,
                    "top": 52
                },
                "score": 0.9116,
                "line_number": 2
            },

Обратите внимание, что некоторые слова извлекаются хорошо, а числа — нет. Моя основная цель — извлечь денежные значения и даты.

Чтобы создать свою таблицу, я могу использовать свойство "height", чтобы узнать, какое у вас соответствующее числовое значение.

Итак, как мне извлечь числа?

PS.: Это португальский (BR) документ.

ibm-cloud ibm-watson visual-recognition

Augusto 17.07.2019 источник

Ответы (1)

arrow_upward
1
arrow_downward

Благодарим вас за интерес к сервису... однако, в том виде, в каком он доступен сегодня, эта бета-версия сервиса в основном обучена словарю английского языка. Хотя он может распознавать короткие числовые строки, он не особенно хорошо справляется с такими задачами, как чтение произвольных чисел, таких как цены, серийные номера или номерные знаки. Также, вероятно, не будут найдены слова на бразильском португальском языке.

Matt Hill 18.07.2019

comment

Есть ли способ обучить или улучшить распознавание этих типов чисел? - Augusto; 18.07.2019

comment

к сожалению, нет, эта часть сервиса не обучаема. Однако вы можете обучить пользовательский классификатор создавать метки, применимые ко всему изображению, например, чтобы отличать печатные квитанции от рукописных. - Matt Hill; 19.07.2019

Как извлечь номера изображений с помощью IBMCloud Visual Recognition Text?

Ответы (1)

Вопросы по теме