Hadoop Pigを使用して、複数行の各レコードのテキストファイルからデータをロードしますか？

U: john 
T: 2011-03-03 12:12:12 
L: san diego, CA 

U: john 
T: 2011-03-03 12:12:12 
L: san diego, CA

/Hadoopの/豚/どんな分析用のwがこのファイルを読むための最良の方法は何ですか？

データの書き込み方法を制御する方法はありますか？これをタブ区切りに移動するプロセスを書くことは、これを箱から出すのに役立ちます。

それ以外の場合は、カスタムレコードリーダー（PigまたはJava MapReduce）を書くことが唯一の選択肢かもしれません。どちらも非常に困難です。

2011-07-18 17:41:04

残念ながら、データの書き換えはオプションではありません。私はカスタムレコードリーダーを書く方法を考え出すことはあまりありませんでした。これがどういう仕組みになっているかを例にして助けてくれますか？ありがとう！ –

InputFormatを実装する必要があります：http://hadoop.apache.org/mapreduce/docs/r0.21.0/api/org/apache/hadoop/mapreduce/InputFormat.html –

RecordReader：http://hadoop.apache.org /mapreduce/docs/r0.21.0/api/org/apache/hadoop/mapreduce/RecordReader.html –

答えて