2017-03-01 12 views

答えて

2

Spark Dataset.persistでのすべてのキャッシュ操作は遅延しており、キャッシングの対象として指定されているオブジェクトのみが評価されます。

RDDとの主な違いは、評価が推論するのがずっと難しいことです。開発者リストに関する関連ディスカッションを参照してください:Will .count() always trigger an evaluation of each row?

関連する問題