2012-03-01 6 views
0

主に異なるファイルタイプのテキスト抽出に使用されるワークフロー配布プラットフォームを作成しました。これは、ファイルを処理し、テキスト抽出可能なそのファイル内のすべての埋め込み項目を再帰して動作します。作成された各ワーカー項目は、GUIDによって一意に識別され、親GUIDも持ちます。埋め込み項目のないファイルの場合、ワーカー項目GUIDと親GUIDは等しくなります。ファイルにアイテムが埋め込まれている場合は、一意のGUIDを持つ埋め込みアイテムごとにワーカーアイテムが作成され、そのGUIDはファイルのGUIDと同じです。一例として、Outlookメッセージファイルは添付ファイルを含むことができ、添付ファイルは埋め込みアイテムを含むことができる(すなわち、Word文書内にスプレッドシートを挿入する)。分散処理をサポートするツリー構造

元のファイルの処理中の項目の再帰が完了したときに、クライアントに通知を送信するインターフェイスを提供したいと考えています。私はすでに私が望むことをするために木構造を書いていますが、それは馬鹿げた素朴なようです。上に概説したものを提供する既知のパターンやライブラリはありますか?

答えて

1

クォードツリーとクワッドキーを使用できます。クアッドキーは通常マップアプリケーションで使用されますが、クォドキーではツリーを別の順序でソートすることもできます。特定のコアに割り当てるときに並列プロセスを分散するのに役立ちます。

+0

ありがとう、私はその技術を見ていきます。 – user481779