Oracle Vs Hadoop(Hive)の索引付けを比較する必要があります。これまで、Hiveでは、COMPACT INDEXINGとBITMAP INDEXINGの2つの主要なインデックス作成手法が見つかりました。 Oracleと比較して、HiveのCOMPACT INDEXINGのパフォーマンスの違いを調べることができました。私はHiveでビットマップ索引付けを使用するより多くのユースケース/シナリオを理解する必要があります。また、HiveがOracleのように逆キー索引、昇順および降順索引をサポートしているかどうかを知る必要があります。Hadoop over Oracleのテーブルでインデックスを使用することに利点はありますか?
1
A
答えて
1
- YES HIVEは、大規模なデータセットに適しており、 はまだHIVEリアルタイムデータ ウェアハウジングツール作るの発展は彼らのであることを念頭に置いて、 オラクル上HIVEにインデックスを使用しての重要な利点は、彼らのです。 列を持つ表が異なる値を持つと明らかにそれが大きな 表べき場所BITMAPのインデックスを使用することができる
- つのユースケースは、(テーブルが大きい場合は、より良い結果を得るでしょう、小さなテーブルと をテストしていない)であります。
- 現在のところHIVE明示的に索引を作成するための2つの索引付け技術COMPACTおよび BITMAPのみをサポートしています。
- また、ハイブのインデックスは推奨されません(ただし、ユースケースごとに として作成できます)。その理由はORC Formatです。
ORC形式では、読み取り時にフォーマットが のデータをスキップできるようにするインデックスが組み込まれており、Bloomフィルタのインデックスもサポートしています。 これは、Hive Indexesのやり方をほとんど複製しており、 外部テーブルを管理する必要なく、自動的にデータ形式で を実行します(これは本質的にインデックスで起こります)。
ORCテーブル を正しく設定するために時間を費やすことをお勧めします。
hive indexingについてもこの素晴らしい投稿を読んでください。
0
ハイブは、hadoopで実行されるデータウェアハウジングツールです。それはハイブクエリのためのmapreduce能力を持っています。メタデータとactulaのデータは分離され、Apache Derbyに格納されます。データベースへの負担が非常に少なくなります。ハイブは、分散性のために大きなテーブルを簡単に処理します。また、OracleとHiveの内部結合のパフォーマンスを比較することもできます。ハイブは常により良いパフォーマンスを提供します。
関連する問題
- 1. LF over CRLFを使用する利点はありますか?
- 2. Redux over Reactを使用する利点は何ですか?
- 3. アプリケーションデータベースを使用パターンで分けることに利点はありますか?
- 4. ニューラルネットワークにテンソルフローを使用する利点はありますか?
- 5. userscriptでは、querySelector()とjQueryの$()を使用する利点はありますか?
- 6. Mantra.jsアーキテクチャフレームワークを使用する利点はありますか?
- 7. PHPでオブジェクトを使用するとパフォーマンス上の利点はありますか?
- 8. Oracle Designerを使用する利点は何ですか?
- 9. Kinect SDK 2.0の本文インデックスの代わりにボディIDを使用する利点はありますか
- 10. Androidサポートライブラリの使用に不利な点はありますか?
- 11. フォアグラウンドサービスにContext.startService(Intent)の代わりにContext.startForegroundService(Intent)を使用することに利点はありますか?
- 12. SharedPreferencesの代わりにDataLayersを使用することに不利な点はありますか?
- 13. リンクの代わりにボタンを使用する利点はありますか?
- 14. このリファクタリングには何か利点はありますか?
- 15. PDO :: queryとmysql_queryを使用することによるセキュリティ上の利点はありますか?
- 16. `unreachable!` vs `panic!`を使用するとパフォーマンス上の利点はありますか?
- 17. Oracleのパーティション表でローカル索引を使用する利点はありますか?
- 18. 「ダム」データストア以外の目的でMySQLを使用することに利点はありますか?
- 19. ActiveMQの "vm:"トランスポートで "failover:"プロトコルを使用することに利点はありますか?
- 20. x64としてアセンブリをコンパイルすることに利点はありますか?
- 21. Objective-Cでブロックを関数に使用する利点はありますか?
- 22. 非推奨のGoogleAppEngineLauncherではなく、Terminalを使用することの不利な点はありますか?
- 23. anglejsにテンプレートをプリフェッチすることの利点はありますか?
- 24. MacPortsとRubyGemsを同時に使用することに不利な点はありますか?
- 25. .net 4のno-PIA機能を使用することによるパフォーマンス上の利点はありますか?
- 26. AJAXレスポンス用のJSON over HTMLの利点
- 27. 保存されたprocsでPRINTを使用することに不利な点はありますか?
- 28. レポートモジュールの単一サーバーで別々のデータベースを使用することの利点はありますか?
- 29. エンティティを使って "mapped by"というIDを使用することに利点がありますか? ?
- 30. Djangoのライブラリをアプリに変えることの利点はありますか?
ORC形式の索引を作成していただきありがとうございます。 –