2
以下は、実行エンジンを使ってHiveをtezとして実行しようとしているクエリです。Tezで無限の時間を稼働しているハイブクエリ
SELECT A.CITY, A.NAME, B.PRICE
,(ROW_NUMBER() OVER (PARTITION BY A.NAME ORDER BY B.PRICE)) AS RNUM
FROM TABLE1 A
LEFT JOIN TABLE2 B
ON A.NAME = B.NAME
WHERE (A.COLUMN2 >= B.COLUMN3 AND A.COLUMN2 < B.COLUMN4)
GROUP BY A.CITY, A.NAME, B.PRICE;
- は、私はそれがどんな結果なし時間 稼働し続けハイブで私のデータのクエリ上で実行されますが、構文的にクエリを超える正しい場合。
- TABLEAとTABLEBには、何百万ものレコードがあります。
データ形式を変更し、コンテナのサイズを増やし、減速器の数を変更し、ヒープサイズを変更しようとしました。どのようなパラメータを変更しても、クエリは停止しています。
私のさらなる調査では、where条件とwindow関数によってクエリが無限に実行されていることがわかりました。
- 巨大 データに端から端までを実行して、クエリを行います変更はどのようなものです:ここでは は私の質問ですか?
おかげであなたの助け