2016-12-27 8 views
1

Oracle Vs Hadoop(Hive)の索引付けを比較する必要があります。これまで、Hiveでは、COMPACT INDEXINGとBITMAP INDEXINGの2つの主要なインデックス作成手法が見つかりました。 Oracleと比較して、HiveのCOMPACT INDEXINGのパフォーマンスの違いを調べることができました。私はHiveでビットマップ索引付けを使用するより多くのユースケース/シナリオを理解する必要があります。また、HiveがOracleのように逆キー索引、昇順および降順索引をサポートしているかどうかを知る必要があります。Hadoop over Oracleのテーブルでインデックスを使用することに利点はありますか?

答えて

1
  • YES HIVEは、大規模なデータセットに適しており、 はまだHIVEリアルタイムデータ ウェアハウジングツール作るの発展は彼らのであることを念頭に置いて、 オラクル上HIVEにインデックスを使用しての重要な利点は、彼らのです。 列を持つ表が異なる値を持つと明らかにそれが大きな 表べき場所BITMAPのインデックスを使用することができる
  • つのユースケースは、(テーブルが大きい場合は、より良い結果を得るでしょう、小さなテーブルと をテストしていない)であります。
  • 現在のところHIVE明示的に索引を作成するための2つの索引付け技術COMPACTおよび BITMAPのみをサポートしています。
  • また、ハイブのインデックスは推奨されません(ただし、ユースケースごとに として作成できます)。その理由はORC Formatです。
  • ORC形式では、読み取り時にフォーマットが のデータをスキップできるようにするインデックスが組み込まれており、Bloomフィルタのインデックスもサポートしています。 これは、Hive Indexesのやり方をほとんど複製しており、 外部テーブルを管理する必要なく、自動的にデータ形式で を実行します(これは本質的にインデックスで起こります)。

  • ORCテーブル を正しく設定するために時間を費やすことをお勧めします。

    hive indexingについてもこの素晴らしい投稿を読んでください。

+0

ORC形式の索引を作成していただきありがとうございます。 –

0

ハイブは、hadoopで実行されるデータウェアハウジングツールです。それはハイブクエリのためのmapreduce能力を持っています。メタデータとactulaのデータは分離され、Apache Derbyに格納されます。データベースへの負担が非常に少なくなります。ハイブは、分散性のために大きなテーブルを簡単に処理します。また、OracleとHiveの内部結合のパフォーマンスを比較することもできます。ハイブは常により良いパフォーマンスを提供します。

関連する問題