2
私は次の形式で私のデータファイルを持っている:Hadoop Pigを使用して、複数行の各レコードのテキストファイルからデータをロードしますか?
U: john
T: 2011-03-03 12:12:12
L: san diego, CA
U: john
T: 2011-03-03 12:12:12
L: san diego, CA
/Hadoopの/豚/どんな分析用のwがこのファイルを読むための最良の方法は何ですか?
残念ながら、データの書き換えはオプションではありません。私はカスタムレコードリーダーを書く方法を考え出すことはあまりありませんでした。これがどういう仕組みになっているかを例にして助けてくれますか?ありがとう! –
InputFormatを実装する必要があります:http://hadoop.apache.org/mapreduce/docs/r0.21.0/api/org/apache/hadoop/mapreduce/InputFormat.html –
RecordReader:http://hadoop.apache.org /mapreduce/docs/r0.21.0/api/org/apache/hadoop/mapreduce/RecordReader.html –