Извлечь текст из SWF

В настоящее время мы используем print2flash (http://print2flash.com) для преобразования документов, представленных пользователями (документы Word, RTF, PowerPoint, и т. д.) в документы на основе Flash, которые можно просматривать в Интернете (например, docstoc и scribd).

Мы хотели бы проиндексировать текст внутри этих файлов для полнотекстового индексирования. Существуют ли какие-либо инструменты или библиотеки, которые мы можем использовать для этого?

Мы разрабатываем в ASP.NET/C# и пробовали работать со сторонними инструментами, такими как SWFTools (http://www.swftools.org), но результаты были непоследовательными и некачественными.

PS: Мы хотели бы выполнить индексацию после того, как исходный документ был преобразован во флэш-память, потому что это дает нам меньше форматов файлов для работы.


person Arthur Chaparyan    schedule 12.05.2009    source источник


Ответы (1)


Лучше всего использовать стороннюю библиотеку синтаксического анализа Flash. Flash имеет очень плотный формат и его сложно разобрать. Сказав это, формат хорошо понятен. Официальную спецификацию можно найти здесь: http://www.adobe.com/devnet/swf/< /а>

person ashes999    schedule 24.08.2010