Я выполняю распознавание текста с помощью Tesseract 2.04 на некоторых изображениях, и теперь мне нужно получить точное положение текста. Но эта версия не возвращает эту информацию.
Мне нужно это для создания файла PDF с возможностью поиска. Я уже научился штамповать текст в нижнем слое PDF-файла, но мне нужна позиция для штампа этого текста. Моя первая идея - выполнить распознавание в pdf, получить текст и положение текста, чтобы поставить печать в pdf с помощью iText api.