Я никогда раньше не использовал python и не знаю, с чего начать. Моя цель — взять данные изображения, числа и разноцветный фон, и надежно идентифицировать правильные символы. Я изучил инструменты, необходимые для этого, и нашел дистрибутив Anaconda python, который включал в себя все возможные пакеты, которые мне могут понадобиться для этого, а также tesseract-ocr и pytesser.
К сожалению, я не знаю, как начать. Я использую PyCharm Community IDE и просто пытаюсь следовать этому руководству: http://www.manejandodatos.es/2014/11/ocr-python-easy/, чтобы получить представление об OCR.
Это код, который я использую:
from PIL import Image
from pytesser import *
image_file = 'menu.jpg'
im = Image.open(image_file)
text = image_to_string(im)
text = image_file_to_string(image_file)
text = image_file_to_string(image_file, graceful_errors=True)
print "=====output=======\n"
print text
и я считаю, что дистрибутив Anaconda, который я использую, имеет PIL, но я получаю эту ошибку:
C:\Users\diego_000\Anaconda\python.exe C:/Users/diego_000/PycharmProjects/untitled/test.py
Traceback (most recent call last):
File "C:/Users/diego_000/PycharmProjects/untitled/test.py", line 2, in <module>
from pytesser import *
File "C:\Users\diego_000\PycharmProjects\untitled\pytesser.py", line 6, in <module>
import Image
ImportError: No module named Image
Process finished with exit code 1
Может кто-то указать мне верное направление?
from pytesser import *
? - person Ryan   schedule 28.06.2015