Проблема Tesseract со стадией mftraining

Я успешно создал файл коробки с помощью tesseract
после запуска unicharset_extractor
, создав файл unicharset, который выглядит так:

...
n 3 NULL -1
s 3 NULL 23
t 3 NULL 43
...

Я продолжил эту команду

mftraining -U unicharset -O testlang.unicharset testlang.tr

только чтобы получить следующую ошибку

Reading testlang.tr ...
testlang has no defined properties.

Error: Illegal short name for a feature!

person Asaf    schedule 22.02.2011    source источник
comment
Эти NULL являются частью ожидаемого вывода файла unicharset?   -  person apose    schedule 26.02.2011
comment
Вы когда-нибудь получали этот ответ? У меня тот же вопрос.   -  person frosty    schedule 16.05.2012


Ответы (1)


Я никогда не работал с Tesseract, но кажется, что в базе данных ошибок есть открытая проблема, которая очень похожа на вашу проблему: http://code.google.com/p/tesseract-ocr/issues/detail?id=385

Похоже, это связано с тем, что научная нотация неправильно поддерживается некоторыми функциями.

На странице проблемы один пользователь предлагает решение, а другой предлагает патч. Вы можете попробовать применить патч, чтобы увидеть, поможет ли он.

person Sébastien Nussbaumer    schedule 01.03.2011
comment
ой, не заметил этого, мой плохой. - person Asaf; 05.03.2011