Метаданные XMP из Pdf с использованием PdfSharp

Я хочу прочитать метаданные XMP из документов PDF. Я попытался прочитать данные с помощью PDFsharp (http://www.pdfsharp.net/). Большую часть времени это работало хорошо, но в некоторых случаях я получаю это исключение:

Unhandled Exception: PdfSharp.Pdf.IO.PdfReaderException: Cannot handle iref streams. The current implementation of PDFsharp cannot handle this PDF feature introduced with Acrobat 6.

Где-то читал, что в новой версии этого нет. Итак, я скачал PdfSharp 1.50.3638-beta (https://www.nuget.org/packages/PdfSharp/1.50.3638-beta).

И да, теперь у меня нет исключения. Но моя новая проблема в том, что функция PdfReader.open не работает на некоторых документах. Это означает, что программа никогда не покидает функцию.

На некоторых форумах я читал, что это может быть вызвано большими документами с большим количеством изображений. Поэтому я попытался прочитать только информацию о документе:

PdfDocument pd = PdfReader.Open(s, PdfDocumentOpenMode.InformationOnly);

Но это все еще не работает. Некоторые идеи, как я могу прочитать метаданные?


person JahRkh    schedule 20.02.2015    source источник


Ответы (1)


Поддержка потоков IRef является новой для PDFsharp 1.50 beta, и если у вас есть файл, который не может быть прочитан, отправьте его на проверку.

person I liked the old Stack Overflow    schedule 23.02.2015
comment
чтобы загрузить версию 1.50, перейдите сюда: nuget.org/packages/PdfSharp/1.50.3638- бета. Вам нужно будет создать логин, чтобы выполнить прямую загрузку zip-архива, содержащего PDFsharp. - person ecoe; 02.03.2015