BigQueryクエリに時間がかかる理由を理解しようとしています。__SHUFFLE1_REPARTITION0からのBigQueryのスピードタイム
Explanation
の出力を解釈するためのいくつかの記事がありますが、ここで何が起こっているのかを理解するのに役立つ情報はありませんでした。
なぜ__PSRC___SHUFFLE2_0
からの読み取りと__SHUFFLE2_REPARTITION0
への書き込みに時間がかかるのですか?これは新しいキーで再パーティション化されていますか?前のステップ、13は、またHASH($290)
によって書かれましたが(これは、現在の70%がこのステップに費やされているの我々のデータのサンプル上の200S、程度かかります。
(私はできません役立つ場合、私は編集さバージョンを投稿することができますが、ここでは全体のクエリを投稿してください。)
ステージ2とステージ5は面白いです。ステージ2は2M行から7Mに移行し、ステージ5は140Mの出力で10M行を取得します。私は結合が爆発していると思う。クエリされたデータのサイズはどれくらいですか? –