Как правильно отредактировать файл PDF с помощью Python?

Я пытаюсь отредактировать файлы PDF с помощью python, перепробовал множество библиотек, таких как pdfrw, pdfminner и даже pyPDF2, но ни одна из них не помогла мне правильно отредактировать содержимое PDF, потому что оказалось, что библиотека объединяет PDF с использованием слоев и размещает мое поле редактирования поверх исходного слоя. Я даже могу выбрать содержимое под полем редактирования (см. изображение). Я попытался сгладить их, это помогло мне, но оказалось, что я даже не могу выбрать или скопировать какое-либо содержимое или найти какую-либо часть.

Проблема с PDF

Проблема с PDF

Поэтому, пожалуйста, предложите мне, как правильно отредактировать содержимое внутри PDF.

Это то, чего я хочу добиться: отредактированная часть больше недоступна, но остальная часть файла


person Marcus    schedule 31.08.2020    source источник
comment
Вам нужно будет найти элементы PDF, которые составляют информацию, которую вы хотите отредактировать, и изменить их, а не просто вставить элементы сверху.   -  person AKX    schedule 31.08.2020
comment
Можете ли вы объяснить немного больше   -  person Marcus    schedule 31.08.2020


Ответы (1)


Наконец, я смог правильно отредактировать содержимое, все, что вам нужно сделать, это получить поток данных PDF и найти объект «TJ», «BT» и «ET», а затем заменить этот текст на Null или на слова, которые вам нужны. заменить. После этого вы также можете создать коробку над ним.

person Marcus    schedule 05.09.2020