2017-05-31 14 views
0

Pigを使用してすべてのレコードを連結したいと思います。 は「pigStorage」と「-tagFile」ラベル付きデータでロードした後、私のデータは次のようになります。ブタの複数のレコードを連結

(filename, aaaaaaaaaaa) 
(filename, bbbbbbbbbbbbbb) 

そして、私が好む結果は次のとおりです。

(filename, aaaaaaaaaaabbbbbbbbbbbbbb) 

その後、私はにデータを保存することができますrowkeyとしてのファイル名を持つHBase

ご意見をお寄せください。

答えて

0

ファイル名でデータをグループ化し、BagToStringを使用して、すべてのバッグを単一の文字列にCONCATします。

B = GROUP A BY filename; 
C = FOREACH B GENERATE group,BagToString(A.$1,''); 
DUMP C; 
+0

返信用のおかげで、I'veはこれを試み、私は(ファイル名、{(ファイル名、AAAAAAAA)、(ファイル名、bbbbbbbbbbb)}得た。私はまた、ファイル名の内部にタプルを削除しようとし、そして得(ファイル名、{(aaaaaaaaa)、(bbbbbbbbbbbbb)} –

+0

@ Y.Wang私は答えを更新しました –

+0

ありがとう!!!! –

関連する問題