外部テーブルからSQL DW内部テーブルにデータをロードしようとしています。私はデータストアをBLOBストレージに圧縮フォーマットで格納し、外部テーブルはBLOBストレージロケーションをポイントしています。Azure SQL DWデータのロードに長時間を要する
約22GBのファイルがあり、大規模なリソースクラスサービス/ユーザーアカウントを使用して、外部テーブルから300 DWUの内部テーブルにデータをロードしようとしています。
私のinsert文(非常に簡単です)は10時間以上実行されています。 Trxdata.Details_dataに挿入* Trxdata.Stage_External_Table_details_dataから挿入します。
私も10時間以上実行している以下の声明で試しました。 表Trxdata.Details_data12 をCREATE( DISTRIBUTION = ROUND_ROBIN )WITH AS SELECT * FROM Trxdata.Stage_External_Table_details_data 。
私はどちらのSQLも "sys"のACTIVEステータスで実行しています "dm_pdw_exec_requests" [私は同時実行スロットの問題である可能性がありますが、実行する同時実行スロットを持っていませんでした]
私は、DWUを増やす/拡大することでパフォーマンスが向上することを期待していました。しかしportal.azure.comでDWUの使用状況を見て - DWUの使用チャートは、私が理解しようとしている最後の12時間だから、
ため< 50DWUを示していたので、私はDWUを増加すると確信していないです - どのように見つけることができますか?このような長い時間がかかっているのですが、データロードのパフォーマンスを向上させるにはどうすればよいですか?
共有するためのもう一つの迅速な統計、私は7圧縮[LZ4形式]ファイルを処理しようとした - 、6.63ギガバイトのサイジング115分SSMSを走る[400 DWU、largercリソースクラスに完成455万件のレコードを含む、使用の文を挿入し、実行していますBLOBストレージとSQL DWと同じ場所にあるWindows Azure仮想マシンから、BLOB + SQL DW + VMはAzureの同じ場所にあります。 – Aravind