При распознавании текста с помощью AWS Rekognition не удается обнаружить большую часть текста

Я использую AWS Rekognition для обнаружения текста из PDF-файла, преобразованного в jpeg. На изображении, которое я использую, есть текст размером примерно 10-12 или обычная буквенная страница. Однако шрифт меняется по всему изображению несколько раз.

Связано ли мое отсутствие обнаружения и низкий уровень достоверности с тем, что в документе часто меняется текст? Маленький шрифт?

По сути, я хотел бы знать, какое изображение / текст мне нужно, чтобы получить наилучшие результаты от алгоритма обнаружения текста?

M Waz 29.11.2017 источник

Ответы (1)

arrow_upward
1
arrow_downward

DetectText API может обнаруживать до 50 слов в изображении.

и для того, чтобы быть обнаруженным, текст должен находиться в пределах +/- 30 градусов ориентации горизонтальной оси.

и вы пытаетесь извлечь страницу, полную текста, вот в чем проблема :)

AWS теперь предоставляет сервис AWS Textract, специально предназначенный для распознавания текста в изображениях и документах.

Mausam Sharma 17.05.2018

При распознавании текста с помощью AWS Rekognition не удается обнаружить большую часть текста

Ответы (1)

Вопросы по теме