私はEMRを使用してfs.moveFromLocalFile APIを使用してローカルファイルシステムからSparkのS3にフォルダを移動しています。アップロードされたすべてのフォルダに対して_ $ folder $という名前のEMRFSによって作成された0バイトのファイルを除いて、すべて正常に動作します。EMRはHDFSのmoveFromLocalFile APIを使用しているときに0バイトのファイルを作成します
このダミーファイルを作成せずにフォルダを移動する方法はありますか? (このファイルを手動で削除する以外)。また、このダミーファイルはなぜ作成されますか?私は現在、EMRチームが推奨するs3://プロトコルを使用しています。
あなたが思っているよりも厄介です。 (a)ファイルの下でmkdirできないこと、そして(b)lsを実行するときに空のディレクトリが存在することを確認する必要があります。 'mkdir path 'というfsの期待されるセマンティクスの中にあります。 ls path'は何か成功したものを返します。 FSクライアントは、下のものが作成されたときにマーカーファイルを削除します –