クラスタ上でsparkアプリケーションを実行しています。私は、RDD内の各要素に対して何らかの操作を行い、各要素をテキストファイルに保存したいと考えています。RDDの要素をSparkアプリケーションに保存する
私はしかし、私はprint文は、すべてのエラー/警告なしで印刷されることを見つけるんがsomefile.txtを見つけることができないのですmyRDD
myRDD.foreach(process)
def process(elements):
// some operation that extracts the strings
// and converts to myList
myList = ...
with open("somefile.txt", "a+") as myfile:
print "----SAVED----"
myfile.writelines(myList)
にforeach
を呼び出しています。 somefile.txtはどこに保存されていますか?私の方法が間違っている場合、どのようにRDDの個々の要素を保存するのですか?
foreachを使用してmyListを保存しますか?可能であればどうすればRDD上の各要素の操作を行い、リストの形で生成された出力を保存するのですか? – vkb