Iは、同じ量のデータが含まれていないタプルを有する:
(A、B、C、D)
(E、F)
(G、H、I)ディバイドタプル
(a)の
(b)の
(C)
(D)
(e)の
(F)
012:私がやりたい何
は、各データのための新しいタプルを作成することです(G)
(H)
(I)の助けあなたが関係Aを持っていると仮定すると
Iは、同じ量のデータが含まれていないタプルを有する:
(A、B、C、D)
(E、F)
(G、H、I)ディバイドタプル
は、各データのための新しいタプルを作成することです(G)
(H)
(I)の助けあなたが関係Aを持っていると仮定すると
ため
おかげで、その後、以下のステートメントは、あなたに必要な出力が得られます。
Data:
a,b,c,d
e,f
g,h,i
あなたが関連して、このデータを持っているとしましょう、A.
A = LOAD 'data file' using PigStorage(',');
次の文の変換:ここ
B = FOREACH A GENERATE FLATTEN(ToBag(*));
は、あなたの必要な結果を(持っているが、それをテスト)を生成する方法であります各列をバッグに入れるには、これは次のステップで必要な結果を得るために必要です。この操作の後、各レコード/タプルには1つの要素bagがあります。
B = foreach A generate TOBAG(*);
Flattenは、各要素をバッグから取り出し、別々の行に配置します。
C = foreach B generate flatten($0);
dump C;
(a)
(b)
(c)
(d)
(e)
(f)
(g)
(h)
(i)