Я пробовал почти все конвертеры pdf в текст, доступные в Linux, но некоторые части текста были повреждены/неточны. Например, одни символы заменены другими, некоторые слова отсутствуют в тексте, который присутствует в pdf. Для некоторых слов преобразованный текст содержит точки с запятой и т. д.
Я также попробовал aspell, чтобы исправить слова, но aspell ничего не говорит о некоторых словах.
ПРИМЕЧАНИЕ. PDF-файл содержит текст на шведском языке.
Итак, есть ли решение исправить эту неточность в преобразовании pdf в текст?