2009-05-12 18 views
0

現在、ユーザーが提出したドキュメント(Wordドキュメント、RTF、PowerPointなど)をオンラインで閲覧できるFlashベースのドキュメント(a la docstocおよびscribd)に変換するためにprint2flashを使用しています。SWFからのテキストの抽出

フルテキストインデックス作成のために、これらのファイル内のテキストにインデックスを作成したいと考えています。これを達成するために使用できるツールやライブラリはありますか?

私たちはASP.NET/C#で開発しており、SWFTools(http://www.swftools.org)などのサードパーティのツールを使用しようとしましたが、結果は一貫性がなく、subparです。

PS:元のドキュメントがFlashに変換された後にインデックスを作成したいと考えています。これは、処理するファイル形式が少なくなるためです。

答えて

1

ベストプラクティスは、サードパーティのFlash解析ライブラリです。 Flashは非常に高密度なフォーマットであり、解析するのは苦痛です。言いましたが、フォーマットはよく理解されています。ここで公式仕様を見つけることができます:http://www.adobe.com/devnet/swf/