Как установить tessedit_write_images в python-tesseract?

Я пытаюсь установить tessedit_write_images, но не могу этого сделать, я нигде не вижу tessinput.tif

я делаю:

import tesseract

api = tesseract.TessBaseAPI()
api.Init(".","eng",tesseract.OEM_TESSERACT_ONLY)
api.SetPageSegMode(tesseract.PSM_AUTO_OSD)
api.SetVariable("tessedit_write_images", "T")

но я пробовал с «True», «1» и некоторыми другими вариантами, похоже, вообще не работает.

Любая помощь?


person tiagosilva    schedule 22.07.2015    source источник


Ответы (1)


tessedit_write_images проверяется только один раз в исходном коде Tesseract (по TessBaseAPI::ProcessPage(), см. ">здесь).

Итак, у вас есть два пути:

  1. Вызовите api.GetThresholdedImage(), и возвращенное изображение будет сохранено, если вы установите переменную и вызовете ProcessPage.
  2. Просто вызовите api.ProcessPage(), и он увидит переменную и выведет tif.
person cortex42    schedule 04.08.2015
comment
Как установить эти параметры через терминал Mac? Я скачал Tesseract и использую его через командную строку, поэтому, когда вы говорите, что должны вызывать такой-то и такой-то метод, я не уверен, что вы имеете в виду. Как я могу это сделать? - person ; 09.07.2017
comment
Важно то, что из-за жестко заданного пути tessinput.tif файл tif будет записан в ваш рабочий каталог без учета параметра командной строки outputbase. - person Pavel K; 27.09.2019