Hadoop over Oracleのテーブルでインデックスを使用することに利点はありますか？

Oracle Vs Hadoop（Hive）の索引付けを比較する必要があります。これまで、Hiveでは、COMPACT INDEXINGとBITMAP INDEXINGの2つの主要なインデックス作成手法が見つかりました。 Oracleと比較して、HiveのCOMPACT INDEXINGのパフォーマンスの違いを調べることができました。私はHiveでビットマップ索引付けを使用するより多くのユースケース/シナリオを理解する必要があります。また、HiveがOracleのように逆キー索引、昇順および降順索引をサポートしているかどうかを知る必要があります。Hadoop over Oracleのテーブルでインデックスを使用することに利点はありますか？

出典

2016-12-27 Amol T K

YES HIVEは、大規模なデータセットに適しており、はまだHIVEリアルタイムデータウェアハウジングツール作るの発展は彼らのであることを念頭に置いて、オラクル上HIVEにインデックスを使用しての重要な利点は、彼らのです。列を持つ表が異なる値を持つと明らかにそれが大きな表べき場所BITMAPのインデックスを使用することができる
つのユースケースは、（テーブルが大きい場合は、より良い結果を得るでしょう、小さなテーブルとをテストしていない）であります。
現在のところHIVE明示的に索引を作成するための2つの索引付け技術COMPACTおよび BITMAPのみをサポートしています。
また、ハイブのインデックスは推奨されません（ただし、ユースケースごとにとして作成できます）。その理由はORC Formatです。
ORC形式では、読み取り時にフォーマットがのデータをスキップできるようにするインデックスが組み込まれており、Bloomフィルタのインデックスもサポートしています。これは、Hive Indexesのやり方をほとんど複製しており、外部テーブルを管理する必要なく、自動的にデータ形式でを実行します（これは本質的にインデックスで起こります）。
ORCテーブルを正しく設定するために時間を費やすことをお勧めします。

hive indexingについてもこの素晴らしい投稿を読んでください。

出典

2016-12-27 10:52:43

ORC形式の索引を作成していただきありがとうございます。 –

ハイブは、hadoopで実行されるデータウェアハウジングツールです。それはハイブクエリのためのmapreduce能力を持っています。メタデータとactulaのデータは分離され、Apache Derbyに格納されます。データベースへの負担が非常に少なくなります。ハイブは、分散性のために大きなテーブルを簡単に処理します。また、OracleとHiveの内部結合のパフォーマンスを比較することもできます。ハイブは常により良いパフォーマンスを提供します。

出典

2016-12-27 11:05:03

Hadoop over Oracleのテーブルでインデックスを使用することに利点はありますか？

答えて

関連する問題