現在、ユーザーが提出したドキュメント(Wordドキュメント、RTF、PowerPointなど)をオンラインで閲覧できるFlashベースのドキュメント(a la docstocおよびscribd)に変換するためにprint2flashを使用しています。SWFからのテキストの抽出
フルテキストインデックス作成のために、これらのファイル内のテキストにインデックスを作成したいと考えています。これを達成するために使用できるツールやライブラリはありますか?
私たちはASP.NET/C#で開発しており、SWFTools(http://www.swftools.org)などのサードパーティのツールを使用しようとしましたが、結果は一貫性がなく、subparです。
PS:元のドキュメントがFlashに変換された後にインデックスを作成したいと考えています。これは、処理するファイル形式が少なくなるためです。