現在、巨大なXMLファイルを解析するアプリケーションを開発中です。バッチアプリケーションの並列化
ファイルごとに異なるプロセスがありますが、すべてが単一のオブジェクトモデルに解析されます。
現在、各XMLファイルから解析されたオブジェクトは、単一のコレクションに入れられます。
このコレクションは、解析中にも使用されます。同様のオブジェクトがすでに存在する場合は、カウントの追加など、オブジェクトのプロパティを変更します。
このアプリケーションが動作しているときのCPUグラフを見ると、CPUの一部(一度に1つのコアは100%)しか使用していないことがわかります。したがって、並列実行すると、 。
私は並列プログラミングには新しく、どんな助けにも感謝しています。
これらのXMLファイルを1つのオブジェクトモデルに解析すると、それらがメモリにロードされることを意味しますか?もしそうなら、このオブジェクトモデルで次に何をするつもりですか?いくつかの操作/変換を実行せずに他の場所に保存するのであれば、メモリにロードすることはめったに役に立ちません。 –
@darin解析後に追加のプロセスがあります。しかし、それはこの質問の文脈ではありません。 –