Запуск примера кода в pytesseract

Я использую Python 2.6.6 и хочу установить пакет pytesseract. После извлечения и установки я могу вызвать pytesseract из командной строки. Однако я хочу запустить тессеракт в python. У меня есть следующий код (ocr.py):

try:
     import Image
except ImportError:
     from PIL import Image
import pytesseract
print(pytesseract.image_to_string(Image.open('test.png')))
print(pytesseract.image_to_string(Image.open('test-european.jpg'),lang='fra'))

Когда я запускаю код с помощью python ocr.py, я получаю следующий вывод:

Traceback (most recent call last):
  File "ocr.py", line 6, in <module>
    print(pytesseract.image_to_string(Image.open('test.png')))
  File "/pytesseract-0.1.6/build/lib/pytesseract/pytesseract.py", line 164, in image_to_string
    raise TesseractError(status, errors)
pytesseract.TesseractError: (2, 'Usage: python tesseract.py [-l language] input_file')

test.png и test-european.jpg находятся в рабочем каталоге. Может ли кто-нибудь помочь мне запустить этот код? Я пробовал следующее:

  1. Скорректирован tesseract_cmd на «pytesseract».
  2. Установлен tesseract-ocr

Любая помощь приветствуется, так как я пытаюсь решить эту проблему уже несколько часов.


person user6046209    schedule 19.10.2016    source источник
comment
tesseract test.png stdout работает?   -  person wrwrwr    schedule 19.10.2016


Ответы (1)


tesseract_cmd должен указывать на программу командной строки tesseract, а не pytesseract.

Например, в Ubuntu вы можете установить программу, используя:

sudo apt install tesseract-ocr

А затем установите переменную просто tesseract или /usr/bin/tesseract.

person wrwrwr    schedule 19.10.2016
comment
Спасибо за ответ. В моем случае это было в «/usr/local/bin/tesseract». - person user6046209; 20.10.2016