Apache Spark SQLContextとHiveContextの違いは何ですか?Apache Spark SQLContextとHiveContextの違いは何ですか?
HiveContextはSQLContextのスーパーセットであるため、開発者は常にSQLContextより多くの機能を持つHiveContextを使用する必要があります。しかし、各コンテキストの現在のAPIはほとんど同じです。
- SQLContext/HiveContextがより有用なシナリオは何ですか?
- HiveContextは、Hiveで作業している場合にのみより便利ですか?
- また、SQLContextはApache Sparkを使用してBig Dataアプリケーションを実装するために必要なものですか?
sqlcontext使用ハイブの使用を持っている場合には、ハイブ-site.xmlのから設定を読み込むことができるよう、それは一定の余分なプロパティなどが含まれ、まだsqlcontextのスーパーセットでありますHiveContextの唯一の欠点は、それが大きな依存関係にあることです。それ以外に、SqlContextではなく常にHiveContextを使用するのが安全な方法でしょうか。私はSparkR 1.6環境を実行しています。 –
https://jaceklaskowski.gitbooks.io/mastering-apache-spark/content/spark-sql-SparkSession.htmlから "SparkSessionはSpark 2.0の1つのオブジェクトにSQLContextとHiveContextをマージしました。"さらに読むための –