Tesseract или любая другая библиотека OCR

Я ищу объяснение / документацию по API / примеры того, как использовать (и тренировать?) Tesseract в C ++, ничего полезного на странице Tesseract в Google, и еще не нашел что-то в Интернете.

Любые полезные источники, опыт будут более чем приветствоваться, так как я понятия не имею, с чего начать.

P.S.

Я открыт для предложений по другим библиотекам.
Только БЕСПЛАТНЫЕ библиотеки

snoofkin 30.11.2010 источник

Ответы (2)

arrow_upward
4
arrow_downward

У меня есть некоторый опыт работы с Tesseract... простой google "обучающий tesseract" показывает эту страницу: http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract, где вы должны выбрать, какую версию tesseract вы хотите обучить. таким образом, люди все еще решают любые проблемы - я все еще использую версию 2.4. В любом случае, вы увидите, что в обучении тессеракта для определенного «языка» (или того, что должно было называться «шрифты» или «наборы символов») есть около 9 шагов. Вы также можете просто использовать существующий язык «eng», но это зависит от вашего приложения. Например, в моем приложении мне нужно было бы выполнить анализ документа, взять определенный регион и захотеть распознать 13-символьную строку чисел — и мне нужна была высокая точность — и я не хотел, чтобы она читалась как «5» как « S» и «0» вместо «O» и т. д., поэтому было логично создать определенный «язык» моего конкретного набора шрифтов, состоящий только из символов 0..9, тогда как вам может быть все равно, если вы получите дополнительный «шум».

Richard Woolf 30.11.2010

arrow_upward
0
arrow_downward

Tesseract Ocr — это библиотека с открытым исходным кодом для обнаружения оптических символов. Вам просто нужно включить файлы библиотеки, если вы используете Visual Studio. Если вы используете qt Creator, вам нужно собрать библиотеку для работы с QT. Вам нужно использовать CMakelist или Cmake Gui для сборки библиотеки. Вы можете перейти по ссылке Сборка Opencv Ocr для Qt 5.4 mingw

Md. Hanif Ali Sohag 01.08.2015

Tesseract или любая другая библиотека OCR

Ответы (2)

Вопросы по теме