出力ファイルを2012117-part-r-00000の形式で出力します。基本的には、出力ファイルに日付を追加して、日付に従ってファイルを並べ替えることができます。私はOutputFormatとFileOutputFormatを見ましたが、私の場合は役に立ちません。hadoop出力ファイルにカスタム名を与える方法
答えて
私はちょうど新しいAPI、私はorg.apache.hadoop.mapreduce.lib.output.MultipleOutputsを使用することができますし、方法addNamedOutput()
MRジョブの出力ファイル名にはあまり柔軟性がありません。 MultipleOutputFormatのサブクラスを使用します。
MultipleOutputFormat#generateFileNameForKeyValueメソッドを実装する必要があります。このメソッドへの入力を無視し、date + -part-r- + mapred.task.partition
パターンの文字列を返します。 mapred.task.partitionはintなので、0を適切に埋め込んでおく必要があります。
は、私たちはFileOutputFormat.setOutputNameのようなオプションを持っていたと思います以前のリリースの一つで、簡単な方法はありません(JobConfのために見つけましたジョブ、文字列名);また、私のレデューサークラスはすでにレデューサーを拡張していますので、別のクラスを拡張することは大変です。 – RFT
Hadoop APIではそれが表示されません。 –
しかし、私のレデューサークラスはすでに別のクラスを拡張していると述べましたが、静的クラスを組み込み、そのクラスをMultipleOutputFormatを拡張してから、どこかから呼び出すことはできますか? – RFT
- 1. Hadoopカスタム出力RecordWriterエラー
- 2. 各サブディレクトリに移動してファイルを一覧表示し、ディレクトリ名を出力に与える方法
- 3. grep -oにも出力ファイル名を出力する方法
- 4. Nco.ncrcat()に複数の入力ファイル引数を与える方法
- 5. mapreduceジョブ/ hadoop出力ファイルを表示する方法
- 6. Laravel Elixir + Webpack:カスタム出力ファイル名?
- 7. ユーザー名のハイパーリンクを与える方法
- 8. org.commons.ziparchiveentryで外国語のファイル名を与える方法
- 9. 出力ファイル名をフォルダ名と同じにする方法
- 10. 与えられたxsltで入力xmlファイルを知る方法
- 11. SyntaxNetの入力としてファイルのフォルダを与える方法
- 12. テンソル・フロー・モデル・グラフが与えられた場合、入力ノード名と出力ノード名の検索方法
- 13. ダメージを与えずにSDカードにプログラムログを出力する方法
- 14. 二次ソルバー出力を与えるNaN
- 15. 奇妙な出力を与えるCout
- 16. txtファイル(複数)で値の出力を与える
- 17. NewHadoopRDDを使用するときにファイル名を与える方法は?
- 18. Hadoopでカスタム出力フォーマットを実装するチュートリアル
- 19. 出力ファイル(またはダンプファイル)のファイル名をフォーマットする方法
- 20. SortedSetがIEqualitycomparerを使用せずに一意の出力を与える方法
- 21. Custom Partitioner Hadoopでレデューサーあたりの出力ファイル数を設定する方法
- 22. yiiの配列データプロバイダでカスタム総計数を与える方法
- 23. Hadoop入力ファイル
- 24. Hadoopジョブへの入力としてHadoop Sequentilファイルを読み取る方法は?
- 25. mysqlのlike演算子にエイリアス名を与える方法
- 26. 匿名ユーザーにrpc apiへのアクセスを与える方法
- 27. あなたのサーバにドメイン名を与える方法
- 28. Angular2 ||子コンポーネントに2つの入力を与える方法。
- 29. 注入型関数に入力を与える方法
- 30. スクロールビュー内でプログレスバーに重力中心を与える方法は?
Sqoopの出力ファイルの名前を変更することは可能ですか? –