Как сослаться на интерфейс PDF IFilter (dll), встроенный в Windows, для извлечения текста и свойств документа PDF с помощью Classic ASP

Я хочу извлечь текст и свойства (автор, заголовок и т. д.) файла PDF.

Мне нужно извлечь и проанализировать текст из файла PDF в классической среде ASP. Я прочитал еще один пост об использовании драйвера PDF iFilter, установленного с Adobe Acrobat 9, на который можно ссылаться через COM.

Это возможно? Если да, то как мне начать?


person Community    schedule 15.04.2009    source источник


Ответы (1)


Если вы знаете имя класса COM или clsid, вы сможете использовать Server.CreateObject() для получения экземпляра. После этого вы сможете вызывать для него методы IFilter.

person KenE    schedule 15.04.2009