Почему Tesseract OCR использует бинаризацию Otsu?

Почему механизм Tesseract OCR использует глобальную технику пороговой обработки, такую как бинаризация Otsu? Разве локальные методы пороговой обработки (например, Sauvola, Niblack и т. д.) не более эффективны для исключения текста из изображений?

ocr tesseract image-thresholding

cjbayron 24.06.2019 источник

Ответы (2)

arrow_upward
1
arrow_downward

Tesseract использовался в книжном проекте Google, и, насколько мне известно, они проводят тесты на лучшую бинаризацию, а Otsu был наиболее универсальным. Если Otsu не подходит для вашего случая, вы можете использовать другой алгоритм бинаризации перед отправкой изображения в tesseract.

user898678 24.06.2019

comment

См. также обсуждение tesseract о гибкой или лучшей бинаризации — особенно некоторые тесты: github. com/tesseract-ocr/tesseract/issues/ - user898678; 20.07.2021

arrow_upward
1
arrow_downward

По сути, в зависимости от входного изображения нам нужно выбрать, какой алгоритм пороговой обработки использовать. Tesseract использует метод Otsu для определения порога, потому что обычно входные данные Tesseract для извлечения текста имеют однородные изображения. Метод Оцу эффективен и достаточно хорош для таких изображений.

Метод глобальной пороговой обработки полезен и достаточно хорош, когда фон не показывает локальных изменений относительно интенсивности переднего плана (цели). В то время как локальное пороговое значение необходимо, когда существует локальная вариация между разницей интенсивности фона и цели.

Таким образом, хотя Tesseract использует метод Otsu (глобальное пороговое значение) для бинаризации, вы можете предварительно обработать изображение с помощью методов локального порогового значения, чтобы получить лучший результат от Tesseract.

vatsal gosar 24.06.2019

Почему Tesseract OCR использует бинаризацию Otsu?

Ответы (2)

Вопросы по теме