Я использую unoconv (https://github.com/dagwieers/unoconv) для преобразования файлов DOCX и DOC. в PDF, но часто получают странные результаты для определенных символов, когда они отображаются в PDF.
Одной из конкретных проблем является странный перевод чисел, например, метка раздела:
Раздел 2.3 (http://note.io/1Q33RX6)
Get превратился в римскую цифру:
Раздел II.3 (http://note.io/1b6MDs5)
У меня есть ощущение, что это связано с установленными наборами символов, но я понятия не имею, как его отлаживать.
Настройкой проблемы является приложение Django, вызывающее сценарий оболочки unix для преобразования документа на диске.