ORCファイルフォーマットをImpalaで使用できますか?また、Impalaのハイブストアに格納されているORCテーブルにアクセスする方法もあります。 は、ドキュメントのリンクの下に見つかり、それがインパラをサポートしていませんORCのいずれかの制限fileformatsリストまたは言及が含まれていません: http://www.cloudera.com/documentation/enterprise/latest/topics/impala_file_formats.htmlORCファイルフォーマットとImpala
0
A
答えて
2
ORCはインパラではサポートされていません。むしろApache Parquetは最高のパフォーマンスを得るための推奨フォーマットです。
0
インパラは、ORCファイル形式を読み取ることができません。可能であれば、ORCファイルをHiveでPARQUETに移行することをお勧めします。メリットは、マップ・リダクション・タスクを設定する時間を1つだけ支払っていることです。
あなたのORCテーブルがnameoforctableあり、非常に基本的なクエリがどのように見える場合:ORCはハイブにACID機能をサポートする唯一のフォーマットであり、いくつかのベンチマークで優れたクエリパフォーマンスと圧縮率を実証していても
CREATE TABLE nameoforctable_parquet
LIKE nameoforctable
STORED AS PARQUET
LOCATION '/your/hdfs/location';
INSERT INTO nameoforctable_parquet
SELECT * FROM nameoforctable
0
インパラはORCファイル形式をサポートしていません。なぜなら、それは主要な競合相手の1つであるHortonworksによって作成されたからです。逆にHortonworks Data Platform(HDP)のHiveバージョンは、同じ理由でParquetをサポートしていません。
関連する問題
- 1. PySparkとHIVE/Impala
- 2. SVGZファイルフォーマット
- 3. Apache ImpalaとCloudera Impalaの違いは何ですか?
- 4. F#ビジュアルスタジオコードでのファイルフォーマット
- 5. Javascript drawImageとnewImage()ファイルフォーマットを変更する
- 6. impala connection via sqlalchemy
- 7. cloudera impala PARQUET_FALLBACK_SCHEMA_RESOLUTION
- 8. Amazon KF8ファイルフォーマットの仕様
- 9. Linuxでのファイルフォーマットの変更
- 10. impalaとhbaseに接続するKerberosエラー
- 11. m4aファイルフォーマットのAudioStreamBasicDescriptionは何ですか?
- 12. SVFファイルフォーマット仕様または処理ライブラリ
- 13. ファイルフォーマットをbashで追加する
- 14. javascriptを使用したIndesignファイルフォーマット
- 15. ココアでのYUVファイルフォーマットの検索
- 16. Cloudera-ImpalaでIS NOT NULL
- 17. Impalaクエリの実行順序
- 18. Impalaシェルにパラメータを渡す
- 19. Impala JDBCドライバ接続エラー
- 20. Project Tango:コンストラクタのエクスポートwavefrontファイルフォーマットの仕様とは何ですか?
- 21. ファイルが認識されない:ファイルフォーマットがCで認識されないエラー
- 22. ハイブはimpalaにはない機能はありますか? Hive vs Impala
- 23. テーブル名から削除するCloudera Impala
- 24. Impala - exists(サブクエリ)VS 0 <(選択カウント(*)...)
- 25. Dockerファイルからimpala sqlスクリプトを実行
- 26. Impalaハイブデータベースにアクセスできない
- 27. Impalaを使用した集会的クエリ
- 28. Impalaのスクラッチディレクトリを確認する
- 29. 挿入エラーのあるPythonアクセスimpala
- 30. impala:パーティションキー/値またはパス空白
_ "HortonworksのHiveバージョン...寄木張りをサポートしていません" _ >>何ですか?あなたはその主張を証明できますか? –
HDPサポートエンジニアとの議論から、HDPは正式にParquetをプラットフォームでサポートしていません。つまり、Parquetを使用することはできますが、何か問題がある場合は自分で解決します。 –
これはちょっと違います:Impala **はImpala固有のC++ライブラリを使用しているため、Apache Parquetという1つのカラムフォーマットしか使用できません。 Apache Hiveは、標準のHive "SerDe" Javaライブラリを提供する多くのフォーマットで動作しますが、HortonWorks **の有料サポート**は、Apache ORC *(Apacheの寄木細工もApache CarbonDataもありません)という1つの円柱フォーマットしかカバーしません。それは理にかなっている。 –