0
私はhadoop-common/src/util
のクラスを読みましたが、ジョブをそのデータセットに関連付けるクラスは見つかりません。mapreduceジョブをhadoopソースコードのデータセットにどのクラスで接続しますか?
どのマップリダクションジョブがどのデータセットに関連しているか、Hadoopはどのように知っていますか?
私はhadoop-common/src/util
のクラスを読みましたが、ジョブをそのデータセットに関連付けるクラスは見つかりません。mapreduceジョブをhadoopソースコードのデータセットにどのクラスで接続しますか?
どのマップリダクションジョブがどのデータセットに関連しているか、Hadoopはどのように知っていますか?
これは、InputFormatによって決まります。
もっと正確には、各MapReduceジョブには、org.apache.hadoop.mapreduce.InputFormat
(org.apache.hadoop.mapreduce.Job#setInputFormatClass
参照)の実装が割り当てられています。これは、入力分割(=入力 'データセット')を決定するためにフレームワークによって使用されます。
あなたはあなたの仕事で使用された実装をチェック、そしてもちろん、独自の実装を設定するために、キーmapreduce.job.inputformat.class
を検索することができます。