Как запустить tesseract из командной строки в Windows XP?

Я установил механизм распознавания текста tesseract на свой рабочий стол Windows XP SP3. Теперь я пытаюсь запустить механизм из командной строки, как указано здесь https://code.google.com/p/tesseract-ocr/wiki./ReadMe

Они дали команду: tesseract imagename outputbase [-l lang] [-psm pagesegmode] [configfile...]

tesseract myscan.png вне

Я пытаюсь прочитать файл с именем CSE_Curriculum, поэтому моя команда выглядит так

tesseract CSE_Curriculum.pdf из

Но это дает мне следующую ошибку

не удается открыть файл: CSE_Curriculum.pdf

Мой установщик включает данные поезда, так в чем проблема? Какими должны быть соответствующие командные строки и куда я должен поместить свой файл. Я протестировал его сохранение в документах, на рабочем столе, а также в документах и ​​настройках.


person Tawfiq Chowdhury    schedule 25.10.2014    source источник
comment
Какие форматы изображений он поддерживает?   -  person Tawfiq Chowdhury    schedule 26.10.2014


Ответы (1)


Tesseract не поддерживает чтение PDF из коробки. Сначала вам нужно преобразовать его в поддерживаемый формат изображения.

person nguyenq    schedule 25.10.2014