1
マイコンピュータはWindowsマシンです。 Eclipse IDEでsparkコードをテストしています。SparkでWindowsネットワークファイルを読み取る
ネットワークフォルダにファイルsample.txt
が保存されています。
ファイルの場所のプロパティは\\\aloha\logfolder
です。
私はsparkcontextでこれを読もうとしています。以下は私のコードスニペットです。私もオプションの下に試してみました
Exception in thread "main" org.apache.hadoop.mapred.InvalidInputException: Input path does not exist: file://aloha/logfolder/sample.txt
:
val conf = new SparkConf().setAppName("WordCount").setMaster("local")
val sc = new SparkContext(conf)
val inp = sc.textFile("\\\\aloha\\logfolder\\sample.txt")
しかし
は、私は次のエラーを得ました。val inp = sc.textFile("file:\\\\aloha\\logfolder\\sample.txt")
val inp = sc.textFile('file:\\\\aloha\\logfolder\\sample.txt')
しかし、いずれも機能していないようです。
同じファイルを私のCドライブにコピーすると、そのドライブが動作します。
val inp = sc.textFile("C:\\Desktop\\logfolder\\sample.txt')
私には何が欠けているのですか?
おかげでRam。あなたはsparkでこれらのファイルを読むための他の回避策を知っていますか? – user7264473
それらをhdfsに手動またはローカルで 'robocopy'を使ってコピーしてください。これは私が知っている唯一のものです。 –