2017-04-06 3 views
0

Iは、同じ量のデータが含まれていないタプルを有する:
(A、B、C、D)
(E、F)
(G、H、I)ディバイドタプル


(a)の
(b)の
(C)
(D)
(e)の
(F)
012:私がやりたい何

は、各データのための新しいタプルを作成することです(G)
(H)
(I)の助けあなたが関係Aを持っていると仮定すると

答えて

0

ため

おかげで、その後、以下のステートメントは、あなたに必要な出力が得られます。

Data: 
a,b,c,d 
e,f 
g,h,i 

あなたが関連して、このデータを持っているとしましょう、A.

A = LOAD 'data file' using PigStorage(','); 

次の文の変換:ここ

B = FOREACH A GENERATE FLATTEN(ToBag(*)); 
0

は、あなたの必要な結果を(持っているが、それをテスト)を生成する方法であります各列をバッグに入れるには、これは次のステップで必要な結果を得るために必要です。この操作の後、各レコード/タプルには1つの要素bagがあります。

B = foreach A generate TOBAG(*); 

Flattenは、各要素をバッグから取り出し、別々の行に配置します。

C = foreach B generate flatten($0); 

dump C; 
(a) 
(b) 
(c) 
(d) 
(e) 
(f) 
(g) 
(h) 
(i)