В настоящее время мы используем print2flash (http://print2flash.com) для преобразования документов, представленных пользователями (документы Word, RTF, PowerPoint, и т. д.) в документы на основе Flash, которые можно просматривать в Интернете (например, docstoc и scribd).
Мы хотели бы проиндексировать текст внутри этих файлов для полнотекстового индексирования. Существуют ли какие-либо инструменты или библиотеки, которые мы можем использовать для этого?
Мы разрабатываем в ASP.NET/C# и пробовали работать со сторонними инструментами, такими как SWFTools (http://www.swftools.org), но результаты были непоследовательными и некачественными.
PS: Мы хотели бы выполнить индексацию после того, как исходный документ был преобразован во флэш-память, потому что это дает нам меньше форматов файлов для работы.