"org.apache.hadoop.typedbytes.TypedBytesWritable"のキーと値のペアを持つSequentialファイルがあります。このファイルをHadoopジョブの入力として提供し、マップ内で処理する必要がありますのみ。私は、減らす必要があることは何もしなくてはならないという意味です。Hadoopジョブへの入力としてHadoop Sequentilファイルを読み取る方法は?
1)私はどのようにFileInputFormatをSequentialFileとして指定しますか?
2)地図機能の署名は何ですか。
3)Reduceではなくマップからどのように出力されますか?
ありがとうPraveen、私は 'job.setInputFormatClass(SequenceFileInputFormat.class);'を使用しました。それはどんな違いを作るでしょうか?どのようなフォーマットでパフォーマンスが向上しますか? – samarth
わかりませんが、SequenceFileAsBinaryInputFormatはSequenceFileInputFormatより高速です。コードを見てみましたが、それはちょっと複雑で、理解するのに時間がかかります。 –