でそれを参照するようにすると、それがデータフレームをキャッシュしてから参照することは可能です(クエリ)には、次のように...私の目標は次のとおりです。?どのように火花データフレームをキャッシュし、別のスクリプト
- スクリプト1では、スクリプト2では
- DFデータフレーム(DF)
- 実行スクリプト1とキャッシュを作成することは、標準的なスパークバイナリを使用しては不可能であるDF
でそれを参照するようにすると、それがデータフレームをキャッシュしてから参照することは可能です(クエリ)には、次のように...私の目標は次のとおりです。?どのように火花データフレームをキャッシュし、別のスクリプト
におけるクエリデータ。スパークDataFrame
は、それを作成するために使用された特定のSQLContext
にバインドされており、その外部からはアクセスできません。
Apache ZeppelinやDatabricksのような、異なるセッションに注入された共有コンテキストを使用するツールがあります。これは、異なるセッションやゲスト言語間で一時テーブルを共有できる方法です。
spark-jobserver
およびApache Igniteを含む他のプラットフォームがあり、分散データ構造を共有する別の方法があります。 Livy serverもご覧ください。
も参照してください:あなたはまた、ファイル/データベースへの実際のデータを保持し、再びそれを読み込むことができShare SparkContext between Java and R Apps under the same Master
。 Sparkはこれを行う方法を提供しているため、データをドライバに収集する必要はありません。