このラインでは、どのRDDが維持されていますか? dropResultsNまたはdataSetN?Apache Sparkここで私は何をしているのですか?
dropResultsN = dataSetN.map(s -> standin.call(s)).persist(StorageLevel.MEMORY_ONLY());
質問は、私はまだどのように最高の時間RDD創出へのコアの質問に良い答えを探していますApache Spark timing forEach operation on JavaRDDからの側の問題、として生じます。
。あなたの答えに何かへのリンクが含まれていて、それを引用してくれればいいです。ソースコードを掘り下げることなく、次に行うことにします。 – JimLohse
NVMの前のコメント私はLearning Sparkの良い例を見つけ、別の答えを投稿しました – JimLohse