処理ログ用に単純なMapReduceプロジェクトをHadoopに実装しました。入力パスは、ログがあるディレクトリです。Hadoop Mapperクラスの入力パスを取得
これはうまく動作しますが、Mapperを実装しているクラスでいつでもログの入力パスがどのように処理されているかを知りたいと思います。 Mapperコードは次のとおりです。
public class StatsMapper extends MapReduceBase implements Mapper<WritableComparable<Text>,Text,Text,Text> {
public static final Log LOG = LogFactory.getLog(StatsMapper.class);
public void configure(JobConf conf) {}
public void map(WritableComparable<Text> key, Text value, OutputCollector<Text,Text> output, Reporter reporter)
throws IOException {
process(key,value);
}
}
事前
を読んRecordReaderオブジェクトのファクトリを提供します タスクにファイルを分割InputSplitsを定義します「ログの入力パスがどのように処理されているか」はどういう意味ですか? –