私はssh
を使用してクラスタに接続されていると私は私がテキストファイルに結果を保存したいクラスタ上でファイルを保存する方法
spark-submit --master yarn myProgram.py
使用してクラスタにプログラムを送信し、私が使用してみました次の行:
counts.write.json("hdfs://home/myDir/text_file.txt")
counts.write.csv("hdfs://home/myDir/text_file.csv")
ただし、いずれも機能しません。プログラムが終了し、テキストファイルがmyDir
に見つかりません。どのように私はこれを行うことができますか考えていますか?
また、ローカルマシンに直接書き込む方法はありますか?
編集:私はhome
ディレクトリは今、私はその結果を保存するように存在していないことが判明: counts.write.json("hdfs:///user/username/text_file.txt")
しかし、これはtext_file.txt
という名前のディレクトリを作成し、内部の私は内部の部分的な結果を持つファイルがたくさんあります。しかし、最終的な結果を含む1つのファイルが必要です。どのように私はこれを行うことができます任意のアイデア?
をこれは私が –
cricket_007 @おかげ方法によって、ディレクトリではないファイルを作ります://home/myDir'? – lads
はあなたが 'HDFS DFS -ls HDFSの出力を表示してくださいすることができていることを知りませんでした –