Мне нужно вызвать tesseract OCR (это библиотека с открытым исходным кодом на C++, которая выполняет оптическое распознавание символов) с сервера приложений Java. Прямо сейчас достаточно просто запустить исполняемый файл с помощью Runtime.exec(). Основная логика будет
- Сохранить изображение, которое в данный момент хранится в памяти, в файл (.tif)
- передать имя файла изображения в программу командной строки tesseract.
- прочитать выходной текстовый файл из Java с помощью FileReader.
Насколько я могу улучшить производительность, написав оболочку JNI для Tesseract? К сожалению, нет JNI-оболочки с открытым исходным кодом, которая работала бы в Linux. Мне пришлось бы сделать это самому, и мне интересно, стоит ли выгода затрат на разработку.