私はクラスタコンピューティングの新機能を使用しています。RStudioでsparklyrを使用すると、ローカルCSVファイルをスパーククラスタにアップロードすることはできますか?
Rstudioで(sparklyrを使用して)spark_context
を作成して、ローカルのSparkクラスタに接続することに成功しました。 copy_to
データフレームをRからSparkにアップロードできますが、ローカルに保存されたCSVファイルをspark_read_csv
を使用して直接Sparkクラスタにアップロードしようとしていますが、最初にR環境にインポートする必要はありません(大きな5GBファイルです)。それは働いていない(場所の前にfile:///という接頭辞を付けても)、それはクラスタに既に保存されているファイルのみをアップロードできるようです。
ローカルファイルを最初にRにロードせずにスパークするようにアップロードするにはどうすればよいですか?
ヒントありがとうございます。
エラーが表示されますか?それが「うまくいきません」と言われていることは何ですか? – cdeterman
'ファイルが見つかりません'というエラーです – renegademonkey