2
分散処理とストリーミングについての最近の議論では、「コードをデータに移動する」と述べています。誰かが同じことを説明するのを助けてくれますか?これらのフレーズの参照はMapReduceWayコード化するデータではなく、「コードをデータに移動する」の原理は何ですか?
hadoopの面では、its stated in a questionでもまだ技術の原理の説明を理解することができませんでした。無関係な方法。
分散処理とストリーミングについての最近の議論では、「コードをデータに移動する」と述べています。誰かが同じことを説明するのを助けてくれますか?これらのフレーズの参照はMapReduceWayコード化するデータではなく、「コードをデータに移動する」の原理は何ですか?
hadoopの面では、its stated in a questionでもまだ技術の原理の説明を理解することができませんでした。無関係な方法。
基本的な考え方は簡単です。コードとデータが別々のマシンにある場合、そのうちの1つを別のマシンに移動してからコードを実行する必要があります。コードがデータよりも小さい場合は、すべてのマシンが同等に高速であれば、データを保持しているマシンにコードを送信する方が良いでしょう。
ビッグデータの世界では、コードはほとんど常にデータよりも小さくなります。