При распознавании текста с помощью AWS Rekognition не удается обнаружить большую часть текста

Я использую AWS Rekognition для обнаружения текста из PDF-файла, преобразованного в jpeg. На изображении, которое я использую, есть текст размером примерно 10-12 или обычная буквенная страница. Однако шрифт меняется по всему изображению несколько раз.

Связано ли мое отсутствие обнаружения и низкий уровень достоверности с тем, что в документе часто меняется текст? Маленький шрифт?

По сути, я хотел бы знать, какое изображение / текст мне нужно, чтобы получить наилучшие результаты от алгоритма обнаружения текста?


person M Waz    schedule 29.11.2017    source источник


Ответы (1)


это официальный снимок документации

DetectText API может обнаруживать до 50 слов в изображении.

и для того, чтобы быть обнаруженным, текст должен находиться в пределах +/- 30 градусов ориентации горизонтальной оси.

и вы пытаетесь извлечь страницу, полную текста, вот в чем проблема :)

AWS теперь предоставляет сервис AWS Textract, специально предназначенный для распознавания текста в изображениях и документах.

person Mausam Sharma    schedule 17.05.2018