Tesseract или любая другая библиотека OCR

Я ищу объяснение / документацию по API / примеры того, как использовать (и тренировать?) Tesseract в C ++, ничего полезного на странице Tesseract в Google, и еще не нашел что-то в Интернете.

Любые полезные источники, опыт будут более чем приветствоваться, так как я понятия не имею, с чего начать.

P.S.

  1. Я открыт для предложений по другим библиотекам.
  2. Только БЕСПЛАТНЫЕ библиотеки

person snoofkin    schedule 30.11.2010    source источник


Ответы (2)


У меня есть некоторый опыт работы с Tesseract... простой google "обучающий tesseract" показывает эту страницу: http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract, где вы должны выбрать, какую версию tesseract вы хотите обучить. таким образом, люди все еще решают любые проблемы - я все еще использую версию 2.4. В любом случае, вы увидите, что в обучении тессеракта для определенного «языка» (или того, что должно было называться «шрифты» или «наборы символов») есть около 9 шагов. Вы также можете просто использовать существующий язык «eng», но это зависит от вашего приложения. Например, в моем приложении мне нужно было бы выполнить анализ документа, взять определенный регион и захотеть распознать 13-символьную строку чисел — и мне нужна была высокая точность — и я не хотел, чтобы она читалась как «5» как « S» и «0» вместо «O» и т. д., поэтому было логично создать определенный «язык» моего конкретного набора шрифтов, состоящий только из символов 0..9, тогда как вам может быть все равно, если вы получите дополнительный «шум».

person Richard Woolf    schedule 30.11.2010

Tesseract Ocr — это библиотека с открытым исходным кодом для обнаружения оптических символов. Вам просто нужно включить файлы библиотеки, если вы используете Visual Studio. Если вы используете qt Creator, вам нужно собрать библиотеку для работы с QT. Вам нужно использовать CMakelist или Cmake Gui для сборки библиотеки. Вы можете перейти по ссылке Сборка Opencv Ocr для Qt 5.4 mingw

person Md. Hanif Ali Sohag    schedule 01.08.2015