2つのテーブルを結合するには共通のキーが必要です。キーなしで2つのデータセットを結合する場合は、CROSSを使用できます。両方のデータセットの積を計算します。
A = LOAD 'a.txt' AS (FullName, Age, CIN);
B = LOAD 'b.txt' AS (evaluation, productivity);
C = CROSS A,B;
あなたは行ずつ参加し、あなたがハックとして(豚0.14以降のみ)一意IDを使用
A = LOAD 'a.txt' AS (FullName, Age, CIN);
B = LOAD 'b.txt' AS (evaluation, productivity);
A1 = FOREACH A GENERATE *, UniqueID(FullName) AS id;
B1 = FOREACH B GENERATE *, UniqueID(evaluation) AS id;
C = JOIN A1 BY id, B1 BY id;
D = FOREACH C GENERATE FullName, Age, CIN, evaluation, productivity;
この完全にすることができ、そのデータは、両方のファイルに順番にあると仮定しますUniqueIDの実装に依存し、次のバージョンでロジックが変更された場合、望ましい結果をフェッチしない可能性があります。
少なくとも2つのデータシートに参加するには、これらのデータシートで共通する1つの列が必要です。 –
他の方法はありませんか? –