Я следую этому руководству: https://cloud.ibm.com/docs/services/visual-recognition?topic=visual-recognition-tutorial-recognize-text&locale=en-US#pr-ximos-passos а>
Моя цель - прочитать документ и составить оглавление. Содержимое имеет тип KEY-VALUE, например "VALUE 10.00". Я могу извлечь текст изображения, но не могу извлечь числа.
- Контекстуализация проблемы:
я использую это изображение
Значения, которые необходимо извлечь:
DATA 13/06/2016
AGENCIA/CASH 0180/2009
VALOR DEPOSITO EM DINHEIRO 50.00
Но когда я использую следующий вызов curl для службы визуального распознавания:
curl -u "apikey:{API_KEY}" --form "[email protected]" "https://gateway.watsonplatform.net/visual-recognition/api/v3/recognize_text?version=2018-03-19" -k
Результат (штука):
"text": "data gigolo hora\nman/em 251\nnumero envelope 689 574\nvalor depusitd eh 4\ncpf no defusnantez 614 220\ndata lananzmnz",
"words": [
{
"word": "data",
"location": {
"height": 18,
"width": 40,
"left": 13,
"top": 10
},
"score": 0.6098,
"line_number": 0
},
{
"word": "gigolo",
"location": {
"height": 43,
"width": 57,
"left": 146,
"top": 0
},
"score": 0.4283,
"line_number": 0
},
{
"word": "hora",
"location": {
"height": 18,
"width": 39,
"left": 249,
"top": 11
},
"score": 0.6533,
"line_number": 0
},
{
"word": "man/em",
"location": {
"height": 17,
"width": 72,
"left": 127,
"top": 35
},
"score": 0.8187,
"line_number": 1
},
{
"word": "251",
"location": {
"height": 21,
"width": 30,
"left": 294,
"top": 33
},
"score": 0.9881,
"line_number": 1
},
{
"word": "numero",
"location": {
"height": 21,
"width": 54,
"left": 12,
"top": 52
},
"score": 0.9116,
"line_number": 2
},
Обратите внимание, что некоторые слова извлекаются хорошо, а числа — нет. Моя основная цель — извлечь денежные значения и даты.
Чтобы создать свою таблицу, я могу использовать свойство "height"
, чтобы узнать, какое у вас соответствующее числовое значение.
Итак, как мне извлечь числа?
PS.: Это португальский (BR) документ.