2016-08-25 7 views
0

私はHIVE 13.1を広く使用しており、Impala 2.5で私の仕事の一部を実行したいと考えています。インパラでは現在のハイブのどの機能が利用できませんか?ワークフローをHiveからImpalaに移行した人はいますか?注目すべきことは何ですか?ハイブはimpalaにはない機能はありますか? Hive vs Impala

+0

DATEおよびDECIMALデータ型。いくつかのALTERコマンド*(ただし、これらはHiveシェルで実行できます)*。 Hiveは常にEXTERNALテーブルの新しいファイルをチェックしますが、Impalaはファイル内のファイルとブロックの場所を保持しているため、各クエリの前に強制的にキャッシュを更新する必要があります。 –

+0

もちろん、ORC、AVROなどはサポートしていません。 –

+0

INSERTコマンドで作成されたファイルの数は実際には制御できません。*(ハイブでは、リダクションの数を調整して "マージ"できます。 smallfiles "プロパティ)*。 –

答えて

0

ここでの問題は、「機能の相違」自体ではなく、むしろユースケースに関係していると思います。

インパラは、1人のユーザーが長時間実行するETLジョブを実行する(したがってフォールトトレランスが主な要件です)場合、Hiveに比べていくつかの利点があります。

インパラは、分析を行うためのBIスタイルのクエリを同時に実行する複数のユーザーが必要とするため、インパラは常にハイブより高速です。

だから、両方に十分な余地があります。

関連する問題