Spark SQlとHiveの違いを理解できたら助かりますか?Spark SQLとHiveの違い
0
A
答えて
2
Apache Hiveデータウェアハウス・ソフトウェアは、分散ストレージに存在し、SQL構文を使用して照会される大規模なデータセットの読み込み、書き込み、および管理を容易にします。 ApacheのHadoopの上に構築され
、ハイブは、以下の機能を提供:報告、従って、このような抽出/変換/ロード(ETL)などのデータ・ウェアハウスのタスクを有効にする、SQLを介して、データへの容易なアクセスを可能にするために
- ツール、およびデータ分析。
- Apache HDFSまたはApache HBaseなどの他のデータストレージシステムに直接格納されたファイルへのアクセス
- Hive LLAP、Apache YARN、およびApache Sliderを使用した2番目のクエリ検索。
- Apacheのスパーク高速かつ汎用クラスタコンピューティングシステムである、ようにデータフォーマットの多様
に構造を課すためのメカニズム。 Java、Scala、Python、Rの高レベルAPI、一般的な実行グラフをサポートする最適化エンジンを提供します。また、SQL用のSpark SQLや構造化されたデータ処理など、豊富な高水準ツールセットをサポートしています。
Spark SQLは、メモリ内処理が核となる構造化データ処理用のSparkモジュールです。 Spark SQLを使用すると、JSON、CSV、寄木細工、avro、シーケンスファイル、jdbc、ハイブなどの構造化されたソースからデータを読み取ることができます。
Spark SQLを使用して既存のHiveインストールからデータを読み取ることもできます。したがって、Spark SQLは、構造化されたデータソースを処理するために使用できる一般化されたモジュールです。
関連する問題
- 1. Hive SqlからSpark Sqlへの変換
- 2. テーブルスキーマ処理の観点から、HiveとParquetのSPARK-HIVEキーの相違点
- 3. Spark SQL - df.repartitionとDataFrameWriterパーティションの違い?
- 4. Apache Spark SQLとMongoDBの違いは?
- 5. Spark SQL to Hiveテーブル - Datetimeフィールド時間Bug
- 6. HiveでSpark SQLクエリを実行
- 7. Hive TBLPROPERTIES from Spark
- 8. jsonキー値とhive/sqlとsparkを読み取る
- 9. HBase/Hive/Sparkのフロー
- 10. Spark Sqlハイブ句が複数あるHive SQLクエリ
- 11. HiveのTRUNCとTO_DATEの違い
- 12. Spark SQL - gzipとスナップとlzoの圧縮形式の違い
- 13. winutilsとhadoop/sparkのPowershell chmod on/tmp/hive
- 14. Cloudera Hive、Horton Works Hive、MapR Hiveの違いは?
- 15. Spark DataSetとRDDの違い
- 16. Spark mllib:implicitTrainとexplicitTrainの違い
- 17. Cloudera Hive on Spark 2.x?
- 18. HiveとSQL Serverのパフォーマンス
- 19. SparkのLookupとJoinの違い
- 20. QuantileDiscretizerとSparkのBucketizerの違い
- 21. mavenアーティファクトspark-core_2.10とspark-core_2.11の間のスパークの違い
- 22. spark-defaults.confのspark。{driver、executor} .memoryとspark-env.shのSPARK_WORKER_MEMORYの違いは何ですか?
- 23. 私の特定のユースケースでHive(on Tez)とSparkの間のパフォーマンスベンチマーク
- 24. Spark SQLの既存のHive永続UDFを使用できません
- 25. Spark Hive - ウィンドウ関数を持つUDFArgumentTypeException?
- 26. Spark/ScalaがHiveにテーブルをロードする
- 27. Spark HiveContext:Spark EngineまたはHive Engine?
- 28. CassとSpark/Sharkのクエリ対Hive/Hadoop(DSEバージョン)の比較
- 29. Spark SQLを使用してHiveパーティションのサブディレクトリにあるデータを照会
- 30. Spark Hive Context - パーティションと大文字のフィールド名を持つAvroテーブル