2011-07-17 2 views

答えて

1

データの書き込み方法を制御する方法はありますか?これをタブ区切りに移動するプロセスを書くことは、これを箱から出すのに役立ちます。

それ以外の場合は、カスタムレコードリーダー(PigまたはJava MapReduce)を書くことが唯一の選択肢かもしれません。どちらも非常に困難です。

+0

残念ながら、データの書き換えはオプションではありません。私はカスタムレコードリーダーを書く方法を考え出すことはあまりありませんでした。これがどういう仕組みになっているかを例にして助けてくれますか?ありがとう! –

+0

InputFormatを実装する必要があります:http://hadoop.apache.org/mapreduce/docs/r0.21.0/api/org/apache/hadoop/mapreduce/InputFormat.html –

+0

RecordReader:http://hadoop.apache.org /mapreduce/docs/r0.21.0/api/org/apache/hadoop/mapreduce/RecordReader.html –

関連する問題