2017-10-23 7 views
0

イテレータを書いたとき(しばらく気に入っています)または非rdd、どのようにapacheは非rddがSystem.outが好きですか?

どのように実際に非rddプロセスをスパークさせ、これをいかに正常化するのですか?

この

public static void main(String[] args) { 
    JavaSparkContext sc = ....; 
    int sum=0; 
    for(int i=0; 0<1000000; i++) 
     sum+=i; 
    sc.wrtieHadoop("/user/text/test.txt"); 
} 

答えて

2

このジョブは、ドライバによってハンドルで、フレームワークApacheのスパークの外にあるコードのすべてのブロックは、ドライバーで実行されますあります。

これは、ドライバで使用するメモリ量を理解する必要がある理由です。なぜなら、複雑な作業を行う場合や、何らかの理由でCollectを実行しようとしたとしても。すべてのプロセスはドライバで実行されます。これは、ドライバですべてを実行する前にsc.writeHadoop

public static void main(String[] args) { 
    JavaSparkContext sc = ....; 
    int sum=0; 
    for(int i=0; 0<1000000; i++) 
     sum+=i; 
    sc.wrtieHadoop("/user/text/test.txt"); 
} 

:あなたのコードが示すように、スパークを実行し、すべてそう

enter image description here

:下の画像を参照してください。それが終わった後、労働者は呼ばれるつもりです。

関連する問題