pysparkとpythonの新機能です。 numpy.savetxt("test.csv",file,delimiter=',')
を使用してローカルシステムにファイルを保存した後、私はosを使用してそのファイルを削除しています。 os.remove("test.csv")
。エラーが発生しましたjava.io.FileNotFoundExceptionファイルファイル:/someDir/test.csvは存在しません。ファイルnumpy.savetxt()
は、読み取り権限のみを持つファイルを作成します。どのように読み書きの許可で同じものを保存することができます。 スパークバージョン2.1の使用pysparkでnumpy.savetxtを使用して作成されたcsvファイルを削除する
1
A
答えて
1
スパーク作業員のように見えますが、ファイルにアクセスできません。マスターとワーカーを異なるサーバーで実行している可能性があります。ファイルを処理しようとしているときに、別のマシンにまたがって作業員を設定すると、これらの作業者がファイルにアクセスできるようになります。同じ場所にあるすべての作業者に同じファイルのコピーを保存できます。 "hdfs:// path/file"のようなHadoopのようなDFSを使用することは常に推奨されます。あなたがするとき、労働者はこれらのファイルにアクセスすることができます。 詳細: Spark: how to use SparkContext.textFile for local file system
+0
Ya、正しい。それはまさに起こったことです。 –
関連する問題
- 1. Windowsサービスを使用してC#またはVB.netを使用してCSVファイルを作成、更新、削除する
- 2. AWKのCSV行を削除したファイルを使用して
- 3. pypyodbcを使用して作成したCSVファイルをフォーマットする
- 4. Pythonを使用して作成したcsvファイルから空白行を削除する方法
- 5. Pythonで作成されたファイルからコンマを削除する
- 6. xp_cmdshellを使用して.csvファイルを削除できません。
- 7. Python Tkinter:forループを使用して作成されたウィジェットを削除します。
- 8. Pandasパッケージを使用して最後の100k行を削除して既存のcsvファイルを作成する
- 9. 特定のパスのPHPでファイル作成操作を使用して作成されたファイルを削除するにはどうすればよいですか?
- 10. AngularJS - $コンパイル(指令)を使用して作成された要素を削除し
- 11. ローカルに削除されたファイルを再作成するには?
- 12. メモ帳を使用してファイルが削除された++ "ディスクから削除"オプション
- 13. インポートされたCSVファイルを使用してActive Directoryからユーザーを削除する必要があります
- 14. Makefile.amで生成されたファイルのサブディレクトリの作成と削除
- 15. vbscriptを使用して%temp%フォルダに作成された一時ファイルを削除する方法
- 16. json2csvを使用して作成したCSVファイルのダウンロード方法
- 17. GCS CLI: "gsutil rm"を使用してファイルを作成日で削除する
- 18. jqueryで.append()を使って作成したdivを削除するには?私はdiv要素は、(.appendを使用して作成した削除したい
- 19. 削除するファイル名をPowershellを使用して出力csvファイルにリダイレクトできませんでした
- 20. BASHスクリプトを使用して古いファイルを削除し、削除されたファイルの総数とサイズを含むテキストファイルを作成します。
- 21. Spotify - なしで作成されたアクセストークンを削除する
- 22. Perlを使用して複数のCSVファイルを作成する
- 23. tclを使用してcsvファイルを作成する方法
- 24. R Cで作成されたcsvファイル入力を使用すると拒否されました。
- 25. File.Deleteを使用してファイルを削除し、Streamwriterを使用して同じファイルを作成しますか?
- 26. csvからローカルアカウントを作成するが、既に作成されたアカウントを削除する方法は?
- 27. タイミングでファイルを作成/削除する
- 28. mavenでデフォルトで作成されたjarを削除します
- 29. ExtAudioFileCreateWithURLで作成したファイルをC++で削除するには?
- 30. 入力としてcsvファイルを使用してRDFファイルを作成する
sparkはおそらく、ファイルをローカルに保存するためにnumpyのapisを使用しているため、ここでは何もしません。 'numpy.savetxt'の後にファイルが実際にローカルシステムに存在するかどうかを手動でチェックしましたか? – Pushkr
はい、ローカルシステム上に存在します。最近私が観察したもう一つの事は、pysparkシェルからそのCSVファイルを読むことができないということです。 –
ローカルファイルシステムから読み込むには、 'filerdd = sc.textFile(" file:///path/to/file.txt ")のような完全なアドレスを与える必要があります。' – Pushkr