Вывод PCL из документа Word с помощью Python

Я создаю веб-приложение, которое будет включать функциональность, которая принимает документы MS Word (и, возможно, ввод из веб-редактора форматированного текста), заменяет значения в заполнители полей формы в этих документах и ​​генерирует документ PCL в качестве вывода.

Я разрабатываю python и django для Windows, но все это решение необходимо будет развернуть на веб-хосте (еще предстоит выбрать), что на практике означает, что решение необходимо будет запускать на Linux.

Я открыт для решений только для Linux, если это единственный способ. Я открыт для решений, связанных с разговором с сервером, написанным на другом языке. Я могу написать C ++ или java, если это необходимо. Конечный результат действительно должен быть в формате PCL.

Мой вопрос: какова хорошая цепочка инструментов для генерации PCL из текстовых документов с использованием python?

Я подумываю использовать какой-то интерфейс для openoffice, чтобы открывать текстовые документы, выполнять замены и отправлять вывод в какой-то драйвер принтера. У кого-нибудь есть опыт в этом? Какие библиотеки вы бы порекомендовали?

Варианты интерфейса, которые я определил, включают следующее: приветствуются любые другие предложения:

Второй подход - использовать что-то вроде paradocx (https://bitbucket.org/yougov/paradocx/wiki/Home), чтобы открыть файлы слов, выполнить подстановки, используя это в python, а затем каким-то образом взаимодействовать с чем-то, что может выводить PCL. Опять же, мы будем благодарны за любой опыт или комментарии по поводу этого подхода.

Я буду очень признателен за любые комментарии к инструментам и цепочкам инструментов, а также идеи или рецепты, которые могут у вас возникнуть.

Этот вопрос касается аналогичных вопросов, но не совпадает с: Как Создать файл PCL из MS Word


person Marcin    schedule 23.01.2012    source источник


Ответы (2)


Ghostscript может читать PS (Postscript) или PDF и создавать PCL. Вы можете использовать библиотеки Python или просто подпроцесс ....

person guettli    schedule 23.01.2012
comment
Спасибо - знаете ли вы о библиотеках python для взаимодействия с ghostscript или о вариантах преобразования word в pdf в python? Если да, буду очень признателен, если вы дадите на них ссылку. - person Marcin; 23.01.2012

Итак, мое окончательное решение заключалось в создании веб-сервиса Java для выполнения моего перекодирования.

  • Docx4j предоставляет класс org.docx4j.convert.out.pdf.viaXSLFO.Conversion, который подключается к apache FOP для преобразования Docx в PDF; который можно легко взломать для преобразования в PCL (потому что FOP выводит PCL)
  • Spark - это легкая веб-платформа Java, которая позволила мне обернуть мой транскодер в веб-службу.
  • Поскольку я также управляю документом, мне нужны метаданные, поэтому идеальным вариантом будет составная форма. Я декодирую это с помощью Apache Fileupload

Практически во всех случаях мне приходилось обновляться до разрабатываемых версий библиотек, чтобы это работало.

На стороне питона я использую:

  • requests для связи с веб-службой.
  • poster для подготовки запроса, состоящего из нескольких частей.
person Marcin    schedule 30.01.2012