データセット＃persist（）は端末操作ですか？

org.apache.spark.sql.Dataset#persist()が呼び出されたときに実際には、キャッシュはDatasetをキャッシュしますか？または、Datasetで何らかの端末操作（countなど）が呼び出されると、遅延してキャッシュされます。データセット＃persist（）は端末操作ですか？

出典

2017-03-01 vatsal mevada

Spark Dataset.persistでのすべてのキャッシュ操作は遅延しており、キャッシングの対象として指定されているオブジェクトのみが評価されます。

RDDとの主な違いは、評価が推論するのがずっと難しいことです。開発者リストに関する関連ディスカッションを参照してください：Will .count() always trigger an evaluation of each row?

出典

2017-03-01 15:01:02 user6910411

データセット＃persist（）は端末操作ですか？

答えて

関連する問題