でこのデータ移行作業のためのベストの並列プログラミングのアプローチ私は2つのテーブルとSQL Server 2008のデータベースを持っている:マイクロソフト/ .NETスタック
- 表A列
ID (int), XmlDocument (xml
を持っている) - 表のB列
ID (int), PdfDocument (varbinary)
を持っています
私はXmlDocumentをとり、PDFに変換できるいくつかの.NETコードを持っています。私は表Aに130万行あり、すべての行を順番に変換するには、1行/秒= 15日で1.3百万行が必要です。
私は2時間以内にこれをやろうとしています。問題は、並列化のための完全なケースと思われます。私の質問は、これを達成するために何を使用すべきか、そして過去に働いた良いアドバイスがあればどうかです。私は仮想マシンラボにアクセスし、いくつかの仮想マシンをスピンアップすることができます。これはどこでもコピーできるテストデータベースです。
たとえば、SQL(サービスブローカーまたはパラレル化のSQLジョブと変換用のCLRプロシージャーを呼び出す)または.NET(複数のマシン上で複数のプロセスまたは複数のスレッドを同じマシンに持つ必要がありますか私をかなり近づけるでしょうか?)ボトルネックは何ですか?スレッド間で作業を共有するためにどのような戦略を使用すべきかについてのご意見はありますか?
はい、私は事前生成を計画していますが、QAが生成プロセスでバグを見つけた場合には、事前生成する必要があります。 –