ジョブでは、2つの異なるディレクトリにある2つの入力ファイルがあります。Hadoop job taking input files from multiple directoriesでは複数のディレクトリからファイルを読み取ることができます。ファイルの名前は同じですが、異なる名前のフォルダにあります。 C1/part-0000 C2/part-0000
マップフェーズでファイルを検出することは可能ですか?以下のような
いくつかの事:各マッパーは、1つの入力分割のために作成されているため public void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException { if (First file) { ... context.write(outputKey, outputValue); } } else { //Second file ... context.write(outputKey, outputValue); } }
複数のディレクトリから入力ファイルを取り出し、マップフェーズでそれぞれを検出する
0
A
答えて
0
は、セットアップ段階で
@Override
protected void setup(Context context) throws IOException, InterruptedException {
FileSplit split = (FileSplit) context.getInputSplit();
Path path = split.getPath();
String name = path.getName();
...
それをチェックし、すべての行のマップ方法でそれをチェックしないでください。
関連する問題
- 1. それぞれの結果をコンソールに出力しますか?
- 2. 複数のディレクトリから入力ファイルを取得するHadoopジョブ
- 3. 複数のテキストパターンをフィルタリングし、それらとそのそれぞれの出現を格納する
- 4. それぞれの出力が次の入力であるオブザーバブルの配列
- 5. ディレクトリからファイルを取り出してコンテンツをSQLに挿入
- 6. 複数のテキストファイル名から行を抽出し、それらの行をテキストファイルから取り出します - Linux
- 7. pug-array出力をカンマなしでそれぞれ
- 8. 複数のファイルをディレクトリにコピーし、それぞれを正しいディレクトリに移動する方法
- 9. 1つの入力ファイルから複数の出力ファイル
- 10. は、複数の入力を検出angularJS
- 11. ディレクトリから複数のオーディオファイルを取り出すためのループループ
- 12. 出力がそれぞれ無限に実行される複数のコマンドの出力を抑制するにはどうすればよいですか?
- 13. Talend:複数の入力ファイルを複数の出力ファイルに
- 14. 複数のプロジェクトからJARファイルを作成します。それぞれ
- 15. シャイニーダッシュボード:複数のメニューアイテムをレンダリングし、それぞれに動的コンテンツを出力する
- 16. webpack複数の入力ファイルと複数の出力ファイル
- 17. HTML入力から複数の値を取り出し、JSONキー、値[配列]
- 18. 複数のループ入力からの出力を印刷する
- 19. それぞれの最後にcsvファイルに結果を出力するwhileループ印刷の複製
- 20. jquery内の関数をそれぞれ呼び出す
- 21. .txtファイルから数値を取り出してC++のベクトルに入れよう
- 22. 複数のファイルから複数の列を切り取り、出力を異なるファイルに出力する方法
- 23. 3つのハイパーリンクを検索し、それぞれを新しいシートに出力する
- 24. 単一入力メッセージから複数の出力を取得する
- 25. それぞれを呼び出して、それぞれの関数を呼び出して実行するメインドライバを1つのプログラムに組み込みます。
- 26. 私は2つのメソッド(それぞれ同じ出力)が
- 27. 場所(都市と州)を自動検出し、その情報を入力フィールドと選択フィールドにそれぞれ入れます。
- 28. すべての項目をそれぞれの行に出力する
- 29. 複数のアイテムをループしてそれぞれをレンダリングする
- 30. 別のファイルを入力としてファイルのディレクトリを検索し、出力を別のファイルに送信するにはどうすればよいですか?