私はSpark 1.6.0を使用しています。私はlog4j.propertiesと他の顧客のプロパティファイルのようないくつかのプロパティファイルを渡したいと思います。 --filesを使うことができますが、SparkContextにaddFileというメソッドがあることもわかりました。両方のオプションが同じであると仮定して、プログラムでファイルを追加するのではなく、--filesを使うのが好きでしたか?SparkContext.addFile vs spark-submit --files
--filesに関する多くのドキュメントが見つかりませんでした--files & SparkContext.addFile both options same?
参考文献約--filesおよびSparkContext.addFileについて見つけました。
SparkContext.addFile java docは「すべてのノードでこのSparkジョブでダウンロードするファイルを追加してください」と言っているので、--filesのように見えますが、addFileもすべてのノードにファイルを転送しますか? –
アプリケーションの一部が分散実行されているため(Sparkはクラスタコンピューティングフレームワークなので)、すべてのノードでリソースが必要になる可能性が高いため、すべてのコンピューティングエグゼキュータでアクセスできるように配布されます。 – gclaussn
私はクラスタモードで実行している場合、私はaddFileまたは--fileを使用してファイルをクラスタに転送できますか?クライアントモードの場合は、addFileとnot - filesを使用するだけです。 –