新しいAPI(apache.hadoop.mapreduce.KeyValueTextInputFormat)では、キーと値を区切るためにタブ(デフォルト)以外の区切り記号(デリミタ)を指定する方法を説明します。Hadoop-.20 APIでKeyValueTextInputFormatセパレータを指定する方法は?
サンプル入力:
one,first line
two,second line
出力リレー必須:これはセパレータとしてタブの正常に動作している
Job job = new Job(conf, "Sample");
job.setInputFormatClass(KeyValueTextInputFormat.class);
KeyValueTextInputFormat.addInputPath(job, new Path("/home/input.txt"));
:
Key : one
Value : first line
Key : two
Value : second line
私のようにKeyValueTextInputFormatを指定しています。
受け入れ答えは、それは私のために正常に動作罰金 –
@SreeVeniが機能していません。 –