最近、私はHbaseとHiveを統合することに関して著者が言及したブログに出くわしました。可能であれば、パフォーマンスとスケーラビリティの両方で両方を使用する利点がありますか。私が間違っていたら、どうか私を正してください。HbaseとHiveを統合する利点は何ですか
答えて
ちょっとセットアップするのは簡単かもしれませんが、CDH3の最終版には組み立てが含まれることがあります。
利点:hbaseでのハイブクエリ。ジョイントと、HBaseデータの集約と簡単な操作を簡単に行う方法を考えてみましょう。
Hiveを使用し、HBaseを気にしないのはなぜですか? HBaseは、オンラインでデータを保持するスケーラブルなストレージインフラストラクチャを提供します。 StumbleUponはライブウェブサイトでHBaseを使用しています。 Hiveはリアルタイムのクエリエンジンではないため、データストアを同様の目的で使用することはできませんでした。 HBaseのHiveは、あなたに両方の世界の恩恵をもたらします。
現在、HBaseとHiveの間でデータを読み込むことができるパッチがあります。あなたはここでそれを見つけることができます:
http://wiki.apache.org/hadoop/Hive/HBaseIntegration
実装のオーバーヘッドはかなり高いように見えます。
HBaseテーブルでスキャンを実行し、外部ファイルに保存してからデータ操作用にHiveにインポートする方が簡単な場合があります。 (これはかなり面倒ですが、もしあなたがそれを定期的に行うのであればスクリプト化することができます。)これは現在私が現在取り組んでいる解決策です。私はそれがどのように進むのかを知らせます。
HBase over Hiveを選択する理由は、実際には入れ替えることはできません。 HBaseは、Hadoopの上に構築された高度にスケーラブルなデータストアを意味し、データ解析をほとんどサポートしていません。一方、Hiveは本番環境でデータを格納するために使用されるのではなく、大量のデータに対して特定のクエリを実行するのが非常に簡単です。
- 1. Hiveで "hive.exec.parallel"をfalseに設定する利点は何ですか?
- 2. Python 3を使用する利点/利点は何ですか?
- 3. プロキシキャッチサーバーを使用する利点と欠点は何ですか?
- 4. JHipsterとHIVEの統合
- 5. Javaアプリケーションの統合テストの作成にGroovyを使用する利点は何ですか?
- 6. アグリゲータープロジェクトと親プロジェクトを分割する利点は何ですか?
- 7. actionCreatorsとmapDispatchToPropsを注入する利点は何ですか?
- 8. "ラムダ式"の利点は何ですか?
- 9. git lfsの利点は何ですか?
- 10. WPFツールバーの利点は何ですか?
- 11. フレームポインタの利点は何ですか?
- 12. pimcoreの利点は何ですか?
- 13. Javascriptモジュールパターンの利点は何ですか?
- 14. ServletRequestWrapperの利点は何ですか?
- 15. マルチコアの利点は何ですか?
- 16. 統合型システムとは何ですか?
- 17. TomcatでAPRを使用する利点(ある場合)は何ですか?
- 18. HBase/Hive/Sparkのフロー
- 19. データウェアハウスとしてHiveを使用している私の場合の利点はありますか?
- 20. cloudera hbaseと飼育係の統合
- 21. kerberized HBaseとのOpenTSDBの統合
- 22. nHibernateのICriteriaとICriterionの違いと利点は何ですか?
- 23. 使用する利点何
- 24. TextBox上でRichTextBoxを使用する利点は何ですか?
- 25. メソッドシグネチャでジェネリックを使用する利点は何ですか?
- 26. MVVMLightでSimpleIoCを使用する利点は何ですか?
- 27. サプライヤをJavaで使用する利点は何ですか?
- 28. C#でインターフェイスを使用する利点は何ですか?
- 29. WebアプリケーションでEJBを使用する利点は何ですか?
- 30. wpfでWeb APIを使用する利点は何ですか?