Hadoopのセールスポイントの1つは、データが計算されていることです。それはWASBとどのように機能しますか? MapReduceジョブを処理するときに、データのブロックが存在する場所でマップおよび縮小タスクが実行されます。このようにして、データの局所性が達成される。 HDInsightの場合、データはwasbに保存されます。 MapReduceを実行すると、データがwasbから計算ノードのそれぞれにコピーされ、処理が進められますか?その場合、計算ノードにデータをコピーする単一のチャネルがボトルネックになります。Azure HDInsightでのデータ配信の処理方法
どのようにデータがwasbに格納され、どのように処理中にデータが処理されるのか説明できますか?
私はあなたが非常に高速なネットワークを持っていたら、データの局所性の使用は(HTTPを減少させることに注意することが重要であると思う:// www.bluedata.com/blog/2015/05/data-locality-is-irrelevant-for-hadoop/、このトピックについても複数の論文があります)。 azureデータセンタで重要な設計上の決定事項の1つは、ストレージがストレージアクセスレイテンシに影響を与えないように計算から厳密に分離されていることです。 –