変換とアクションの間でtextFileが変更されたときにどうなるかを知りたいだけです。 例えば、私は1MBのtextFileからRDDを作成し、flatMap変換を行いますが、 アクション.collectを呼び出す前に、ローカルファイルシステムのファイルを同じ名前の100MBのtextFileに置き換えます。オペレータグラフの生成
アクションコールの後に演算子グラフが生成されるため、大きなファイルからDAGを計算しないでください。データが実際に必要になるまで、私はそれをやってみたら
// RDD created from 1 MB File size
val a = sc.textFile("c:/SampleData.txt").flatMap(x => x.split(" "))
// Replace the textfile SampleData.txt(1 MB size) with SampleData (100 MB size)
a.collect
は、しかし、私は
Caused by: java.io.EOFException: Cannot seek after EOF