Импорт pytesseract

Я пытаюсь использовать pytesseract для OCR (извлечение текста из изображения). Я успешно установил pytessearct с помощью команды -

pip install pytessearct

Когда я пытаюсь установить его снова, он ясно говорит -

Requirement already satisfied (use --upgrade to upgrade): 
pytesseract in ./site-packages

Это означает, что pytessearct успешно установлен. Когда я пытаюсь импортировать этот пакет в свою записную книжку iPython, используя -

import pytessearct

Выдает ошибку -

ImportError: No module named pytesseract

Почему это происходит?


person ComplexData    schedule 05.08.2016    source источник
comment
Является ли этот ./site-packages, поставляемый с установкой python (или) ссылочным путем из каталога вашего проекта?   -  person be_good_do_good    schedule 06.08.2016
comment
Это тот, который поставляется с установкой Python   -  person ComplexData    schedule 07.08.2016
comment
можете ли вы создать переменную окружения PYTHONPATH и полный путь к сайтам-пакетам в качестве значения для созданной переменной (PYTHONPATH)   -  person be_good_do_good    schedule 07.08.2016
comment
Я создал переменную, как вы сказали. Есть ли какие-либо другие изменения, которые мне нужно сделать? Потому что проблема все еще существует.   -  person ComplexData    schedule 08.08.2016
comment
Вы добавили полный путь к сайтам-пакетам в качестве значения той системной переменной, которую вы создали?   -  person be_good_do_good    schedule 08.08.2016
comment
Да. Итак, в файле bash я сделал - export PYTHONPATH = $ (путь к сайтам-пакетам). Это правильно?   -  person ComplexData    schedule 08.08.2016
comment
сделать список пипсов - это список pytesseract?   -  person be_good_do_good    schedule 08.08.2016
comment
Да, это список pytesseract   -  person ComplexData    schedule 08.08.2016
comment
IPython может работать в другой установке Python, отличной от той, на которую устанавливается один pip. Проверьте sys.path внутри IPython, чтобы увидеть каталоги, из которых он попытается импортировать.   -  person Thomas K    schedule 11.08.2016


Ответы (1)


Чтобы использовать Python-tesseract — требуется python 2.5+ или python 3.x — сначала вам нужно установить пакеты PIL и pytesseract через pip:

pip install Pillow
pip install pytesseract

Затем вам нужно скачать и установить tesseract OCR:

https://sourceforge.net/projects/tesseract-ocr-alt/?source=typ_redirect

Насколько я знаю, он автоматически добавляет его в вашу переменную PATH.

Затем используйте его следующим образом:

import pytesseract
from PIL import Image

img = Image.open('Capture.PNG')
pytesseract.pytesseract.tesseract_cmd = 'C:\\Program Files (x86)\\Tesseract-OCR\\tesseract.exe'
print( pytesseract.image_to_string(img) )

Я надеюсь, что это помогает :)

person ajlaj25    schedule 11.08.2017
comment
вместо загрузки ocr: sudo apt install tesseract-ocr - person Roman; 01.11.2018