2017-03-10 9 views
0

私はSpark Cluster Standaloneを使用しています。Spark Driverがローカルファイルを読み取る理由

マスタとスレーブは同じサーバ(サーバB)にあります。

Luigi(サーバーA)を使用してアプリケーションを送信し、展開(クライアントモード)します。

私のアプリケーションはサーバBのローカルファイルを読み込みます。しかし、アプリケーションはサーバAでもファイルを読み込もうとします。なぜですか?

sc.textFile('/path/to/the/file/*') 

答えて

2

クライアントモードでは、ドライバはアプリケーションを送信するクライアントと同じプロセスで起動されます。

ただし、クラスタモードでは、ドライバはクラスタ内のWorkerプロセスの1つから起動されます。

クラスタモードを使用する必要があります。

+0

ニース。あなたはこの文書とリンクしていますか? –

+1

下記のドキュメントを参照してください。 http://spark.apache.org/docs/latest/cluster-overview.html –

関連する問題