サイズが100MBから20GBまでの一連のCSVファイルをロードしようとしています(合計3TB)。だから、できる限りのパフォーマンス向上が必要です。私はファイルグループ化と平均化のための分割を目指しています。私は最適なアプローチを見るために一連のテストを行った。SQL Server:複数のファイルグループを持つパーティションテーブルへの一括データの挿入
まず、さまざまなファイルグループの組み合わせを試しました。私が得意なのは、1つのファイルグループにあるテーブルにロードするときです。複数のファイルが割り当てられており、すべてが1つのディスク上に配置されています。この組み合わせは、複数のファイルグループがある場合よりも優れています。
次のステップは当然のことながらパーティショニングです。 ODDLY、私が調べたすべてのパーティションの組み合わせは、パフォーマンスが低くなっています。私はさまざまなパーティション機能/スキームとさまざまなファイルグループの組み合わせを定義しようとしました。しかし、すべてがより低いローディング速度を示した。
私はここで何が不足しているのだろうか?
これまでのところ、1GBのcsvファイルを3分間で読み込むことができました。どんな考えでも大歓迎です。