2017-08-07 9 views
0

ハイブにテーブルotp_dataがあります。フィールドコードと説明をキャリアと呼ばれる別のテーブルがあり外部からヒーブの別のテーブルにクエリ結果を結合する方法

Total MapReduce CPU Time Spent: 28 seconds 980 msec 
OK 
9E 6.765859659983622 
B6 12.653395748122113 
DL 8.007765572702564 
NW 6.463235656670833 
UA 14.11257661236138 
US 5.717489671893907 
WN 10.383034750411133 
AA 13.280898264437912 
AS 6.848722010417226 
F9 5.919601516833923 

:私は結果

クエリ以下
select carrier, avg(ddelay) from otp_data group by carrier; 

を使用することにより、キャリア名に基づいて、遅延の平均を取ります。キャリアで

サンプルデータ:

9E , Pinnacle Airlines Inc. 
B6 , JetBlue Airways 
--- 
--- 

は、私は(下記のようにotp_dataとキャリア表の結合後)

Pinnacle Airlines Inc. 6.765859659983622 
JetBlue Airways  12.653395748122113 
------- 
------- 

私を導いてください、どのようにこれを達成するために、結果を印刷する必要がありハイブ

ありがとうございます。

答えて

0

あなたは

select t2.carrier_desc, avg(t1.ddelay) 
from otp_data t1 
left outer join carriers t2 
on t1.carrier = t2.carrier 
group by t2.carrier_desc; 
+0

おかげでたくさんのアリ以下のようなものを使用することができます。それは働いています。どのようにddelayに基づいてデータを並べ替えることができますか? – user6582997

+0

あなたはddelayのデータベースを注文することはできませんが、2番目の列で計算されるddelayの平均を注文できます。これを行うには、上記のクエリの最後に "order by 2"スクリプトを追加します –

関連する問題