Я использую одну и ту же версию xpdf на обеих машинах. Однако файл .txt, созданный на ПК с Windows 7, отличается от файла, созданного на Linux-сервере Ubuntu 12.04. Файл .txt для Windows 7 имеет правильный формат с многочисленными разрывами строк, что упрощает синтаксический анализ. Однако версия для Linux вообще не содержит разрывов строк. Существуют ли параметры, которые использует pdftotext в Windows 7, которые мне нужно явно вызывать при работе в Linux?
Вывод pdftotext отличается на ПК с Windows 7 и Linux-сервере, почему?
Ответы (1)
После прочтения следующего http://linux.die.net/man/1/pdftotext справочную страницу я вижу следующее:
-eol unix | dos | mac
Можете ли вы попробовать выполнить со следующими флагами и посмотреть, решит ли это проблему:
pdftotext -eol dos
person
David K
schedule
03.02.2013