apache pig、結果をtxtファイルに保存

こんにちは私は新しいPIGユーザーです私はtxtファイルにいくつかのデータを保存しようとしていますが、STOREコマンドを使用しているときには、次のファイル：_SUCCESSおよびpart-r-00000。apache pig、結果をtxtファイルに保存

この結果をtxtファイルで取得するにはどうすればよいですか？おかげさまで

2016-03-28 matheo972

これは、通常は出力がSTOREのようになります。あなたは豚の内側に以下のようなものを書くことができますので、あなたが内部の豚からのHadoop fsのコマンドを実行することができます方法です

fs -getmerge /my/hdfs/output/dir/* /my/local/dir/result.txt 
fs -copyFromLocal /my/local/dir/result.txt /my/hdfs/other/output/dir/

2016-03-28 17:31:09 Mzf

出力にgetmergeコマンドを使用して、フォルダ内のファイルをマージputコマンドに

hadoop fs -cat /in_dir/part-* | hadoop fs -put - /out_dir/output.txt

または

を使用してファイルを.txtに出力をcatコマンドとパイプを使用してファイルを読むには

を.txtファイル

hadoop fs -getmerge /in_dir/ /out_dir/output.txt

2016-03-28 15:54:48

（ドキュメントhereを参照）、マップを減らすジョブは出力を書き込みます。

豚は、ジョブが一部ファイルの形で出力を書き込むように、内部ジョブをマップ減らす実行されるように：
部-M-00000（出力MAP）または一部-R-00000（出力を低下させます）。

のは、あなたが出力ディレクトリ以下与えているとしましょう（「 /user/output1.txt」）それがありますので、スクリプト内：

/user/output1.txt/part-r-00000 
/user/output1.txt/_SUCCESS

OUTPUT1の内側に作成された複数の部品ファイルがあるかもしれません。 txtの場合は、それらを1つにマージすることができます。

hadoop fs -getmerge /user/output1.txt/* /localdir/output/result.txt 
hadoop fs -copyFromLocal /localdir/output/result.txt /user/output/result.txt

2016-03-30 07:14:49

答えて