HadoopのMap/Reduce部分のデータローカリティ機能は、MySqlサーバなどのHDFS以外の別のストレージを提供するとどうなりますか?言い換えれば、Hadoop Map/Reduceはデータローカリティを使用してデータと同じノード上でマップタスクを起動しようとしますが、データがsqlサーバーに格納されると、タスクノードにローカルデータは存在しません。すべてのデータはSQL Serverノードにあります。その場合、データの局所性が失われるか、データの局所性の定義が変化していますか?それが変わったら、新しい定義は何ですか?HDFSが使用されていない場合のデータローカリティ
答えて
データがクラスタ内に存在しない場合、データのローカリティはありません。すべてのデータをリモートソースからコピーする必要があります。これは、HDFSのデータを含むノードでタスクを実行できない場合と同じです。 S3、HBase、DBなどのリモートソースを使用するいくつかの入力フォーマットがあります。 HDFSにあなたのデータを入れることができればそれは素晴らしいことです。私は頻繁に更新される少量のデータのためにリモートソースとしてMongoを頻繁に使用しており、結果に満足しています。
お返事ありがとうございます。少量のデータが何を意味するのか考えてみてください。また、あなたはこの小さなために起動する同時マッパーをいくつですか?私は全体像を得たいだけです。 – iCode
私の最大のテーブルはおそらくMongoで20MBです。私はちょうど1マッパーを使用します。使用するマッパーの数は、シャーディングに依存します。 https://github.com/mongodb/mongo-hadoopをご覧ください。 –
これは、ネットワーク帯域幅によって制限されるサイズを追加する必要があります。 –
- 1. ルートが設定されている場合と使用されていない場合のモジュールの使用
- 2. Storm 1.0.2 hdfs-boltデータが送信されない場合のタプル
- 3. SparkのスタンドアロンとHDFSを使用したデータローカリティ
- 4. Coutが使用されていない場合のみC++ segfault
- 5. 画像がLaunchScreen.storyboardで使用されている場合に画像が更新されない場合
- 6. ソースがセットとしてフォーマットされていない場合のOPENJSONの使用
- 7. IDが使用されていないWhere句が使用されていない場合に結果が設定されない
- 8. PHPを使用している場合にCSSが適用されない
- 9. varパラメータが推奨されていない場合のremoveAtIndexの使用方法
- 10. スキャナが使用中にステートメントがトリガされない場合
- 11. gpsが使用されない場合はアプリがクラッシュする
- 12. @propertyが使用されない場合があります
- 13. タイムスタンプが使用されていない場合にのみ挿入
- 14. yii2notのフラッシュメッセージがjsコードで使用されている場合
- 15. FragmentPagerAdapterが使用されている場合のコンテナは
- 16. クラッシュQtの:: DecorationRoleが使用されている場合
- 17. ストリングがequalsを使用して実行されていないが、作品が含まれている場合
- 18. Chromeでハイパーリンクを使用している場合、AFrameコンテンツがレンダリングされない
- 19. Reactを使用している場合、ウェブサイトにソースコードが表示されない
- 20. SxssfTransformerを使用している場合、数式が評価されない
- 21. "strict"ディレクティブが使用されている場合、IE11で動作しないテンプレートリテラル
- 22. springアプリケーションとjpa repositiryが使用されていない場合@Transactional
- 23. 使用時にTinyMCEが表示されない場合
- 24. SparkをHDFSで使用する場合、どのようにHDFSを設定すればよいですか?
- 25. 「new」キーワードを使用する場合と使用しない場合の違いを教えてください
- 26. postgres:インデックスが使用されている場合
- 27. MVC4 EF親が挿入されていない場合、子がある場合
- 28. サポートされていないクラスメソッドが使用されている場合、コンパイラエラーをスローする
- 29. パラメータが使用されていない場合( 'next'が宣言されていても使用されていない場合)角度のAOTガードがスローされるエラー
- 30. テーブルエイリアスが提供されていない場合、どのテーブルが使用されますか?
Hadoopのどの部分ですか? MapReduce? –
あなたの質問を理解できません! – Debaditya
私は質問を更新しました。うまくいけば、それは今より明らかです。 – iCode