私はHadoop in Actionを読み、Java
にMultipleOutputFormat
とMultipleOutputs
クラスを使用していることを見つけ、我々は複数のファイルにデータを減らすことができますが、どのように私はわからないことですPython streaming
を使って同じことを達成してください。例えばPythonのストリーミング:?複数の出力を低減するための方法(Javaのとその可能性が)
:誰もが知っている場合
/out1/part-0000
mapper -> reducer
\ out2/part-0000
は、聞いて、行って同じようなことは、私は
どうすれば使用できますか? jarをダウンロードして、私が今までに書いたマップ/リダクションジョブに影響を与えずに "-libjar feathers.jar"を付けてください。これを使用して参照できるサンプルテストコードは参考になります – daydreamer