ハイブで結合操作をしています。しかし、減速機が99%に達すると、減速機が動かなくなります。Hiveを使用して歪んだデータを処理する方法は?
次に、テーブルにスキューデータがあることがわかりました。 Ex。テーブルAには100万のデータがあり、テーブルBには10kしかありません。テーブルAには80%の値があり、残りはその他です。だからハイブレデューサーはその価値にこだわりました。ここで
は私のクエリです:
INSERT INTO TABLE xyz SELECT m.name, m.country, m.user_type, m.category FROM A m JOIN category n ON (m.name = n.name) where country=2 GROUP BY m.name, m.country, m.user_type, m.category;
だから可能な解決策を提案してください。どのように私はこの種のデータに対して結合操作を処理できますか?
http://stackoverflow.com/questions/32370033/hive-join-optimization/32373086#32373086 –
返信いただきありがとうございます@KishoreKumarSuthar。それは何かクールです。 –