0
私はデータの1列を生成する単純な豚の仕事を持っています。出力から空白行を排除するために、私は、次のコマンドを書いた:PIGは空白行を生成します
items = FOREACH inputs GENERATE item;
items = DISTINCT items;
items = FILTER items BY ($0 IS NOT NULL);
items = FILTER items BY NOT IsEmpty(TOBAG($0));
STORE items INTO '$output/items';
私はNULLと空のエントリを削除しようとしますが、私はまだHDFS上の出力ファイルに空白行を取得します。
私はとの最後の行(すなわちSTORE)を交換する際には、端末出力が空白の出力行を表示しません
DUMP items;
、注目に値します。
この問題の根本原因に関するご意見は高く評価されます。