Почему Tesseract OCR использует бинаризацию Otsu?

Почему механизм Tesseract OCR использует глобальную технику пороговой обработки, такую ​​как бинаризация Otsu? Разве локальные методы пороговой обработки (например, Sauvola, Niblack и т. д.) не более эффективны для исключения текста из изображений?


person cjbayron    schedule 24.06.2019    source источник


Ответы (2)


Tesseract использовался в книжном проекте Google, и, насколько мне известно, они проводят тесты на лучшую бинаризацию, а Otsu был наиболее универсальным. Если Otsu не подходит для вашего случая, вы можете использовать другой алгоритм бинаризации перед отправкой изображения в tesseract.

person user898678    schedule 24.06.2019
comment
См. также обсуждение tesseract о гибкой или лучшей бинаризации — особенно некоторые тесты: github. com/tesseract-ocr/tesseract/issues/ - person user898678; 20.07.2021

По сути, в зависимости от входного изображения нам нужно выбрать, какой алгоритм пороговой обработки использовать. Tesseract использует метод Otsu для определения порога, потому что обычно входные данные Tesseract для извлечения текста имеют однородные изображения. Метод Оцу эффективен и достаточно хорош для таких изображений.

Метод глобальной пороговой обработки полезен и достаточно хорош, когда фон не показывает локальных изменений относительно интенсивности переднего плана (цели). В то время как локальное пороговое значение необходимо, когда существует локальная вариация между разницей интенсивности фона и цели.

Таким образом, хотя Tesseract использует метод Otsu (глобальное пороговое значение) для бинаризации, вы можете предварительно обработать изображение с помощью методов локального порогового значения, чтобы получить лучший результат от Tesseract.

person vatsal gosar    schedule 24.06.2019