私の仕事に複数の入力パスがあります。例:ブロックがHadoopのどのファイルパスに属しているかを確認します。
//Driver.class
for (String s : listFile) {
MultipleInputs.addInputPath(job, new Path(s), SequenceFileInputFormat.class);// ex: /home/path1, /home/path2, ...
}
.....
//Mapper.class
public void map(Text key, Data bytes, Context context) throws IOException, InterruptedException {
.....
}
私の質問それはマップ()関数の中で、現在のペア(キー、値)を決定するためにどのような方法がありますさにどのファイル属していますか?
'(JobConf)'メソッドの 'JobConf'からファイルパスを抽出することができます。 javadocs:https://hadoop.apache.org/docs/r2.6.3/api/org/apache/hadoop/mapred/Mapper.htmlの例を参照してください。 – gudok