Я запускаю серию OCR для изображений, используя tess4j в качестве оболочки для tesseract из JAVA. Процесс распознавания по-прежнему занимает значительное время (иногда даже 5 секунд), и я пытаюсь его ускорить.
Я делаю свою собственную предварительную обработку и бинаризацию изображения, и tesseract не нужно выполнять бинаризацию otsu.
Я прочитал учебник для IOS, который позволяет пропустить часть графической обработки, но я ничего не могу найти, используя tess4j.
Туриал здесь: https://github.com/gali8/Tesseract-OCR-iOS/wiki/Tips-for-Improving-OCR-Results -
"... если вы уже выполнили собственную предварительную обработку/пороговое [... ] вы, вероятно, захотите обойти внутренний шаг порогового значения Tesseract».
Кто-нибудь знает, как я могу использовать tess4j (из JAVA) таким образом, чтобы пропустить бинаризацию otsu?