私はhadoopの初心者です。しかし、私はこの興味深い観察をしました。スタンドアロン動作と擬似分散動作で同じ例を実行してHadoopのドキュメントのhadoop擬似分散操作とスタンドアロン操作のパフォーマンス比較
使用the example、
は、スタンドアロンの一方が1分未満を要したが、疑似分散操作は、3分以上かかりました。これは大きな違いです。私は分散モードで余分なネットワークとスケジューリングのオーバーヘッドがあることを理解できました。しかし、違いはあまりにも大きいようです。この例は非常に単純なので、実際の比較ではないかもしれません。
私の質問は、現実世界の仕事のスタンドアロンモードと分散モードの間にどの程度の違いがありましたか?
擬似分散モードまたはスタンドアロンモードは、本番環境では使用されませんので、この質問に有益な回答を得るのは難しいでしょう。 –