2017-10-22 4 views
0

と豚に2つの関係を結合するために私は2つのCSVファイルをしました:どのように複数のフィールド

の1- Fertiltiy.csv:

enter image description here

2 - ライフExpectency.csv:

enter image description here

結果は次のようになります。

enter image description here

私は豚に新しいです、私は正しい答えを得るが、ここに私のコードであることができませんでした。ここで

fertility = LOAD 'fertility' USING org.apache.hcatalog.pig.HCatLoader(); 

lifeExpectency = LOAD 'lifeExpectency' USING org.apache.hcatalog.pig.HCatLoader(); 

A = JOIN fertility by country, lifeExpectency by country; 

B = JOIN fertility by year, lifeExpectency by year; 

C = UNION A,B; 

DUMP C; 

は、私のコードの結果である:

enter image description here

答えて

1

国別と年度別に参加し、最終出力に必要な列を選択します。

fertility = LOAD 'fertility' USING org.apache.hcatalog.pig.HCatLoader(); 
lifeExpectency = LOAD 'lifeExpectency' USING org.apache.hcatalog.pig.HCatLoader(); 

A = JOIN fertility by (country,year), lifeExpectency by (country,year); 
B = FOREACH A GENERATE fertility::country,fertility::year,fertility::fertility,lifeExpectency::lifeExpectency; 
DUMP B; 
+0

ありがとうございました。 DUMP CをDUMP Bに置き換えるだけで正しい答えとして受け入れることができます。 –

+0

@AliZuhair更新しました。受理してくれてありがとうございます。 –

関連する問題