2017-04-24 12 views
3

以下に示すように、Sparkコンソールの出力プログレスバーは出力を乱しています。ステージの進行状況表示バーをオフにするための設定やフラグはありますか?または、ステージの終了後に進行状況バーが消えるようにコンソールログを修正するにはどうすればよいですか?これはPySparkのバグかもしれませんが、わかりません。PySparkはコンソールのプログレスバーを修正/削除します

(CID, (v1/n1, v2/n2)) 
[Stage 46:============================================>   (19 + 4)/24]('1', (0.020000000000000035, 4.805)) 
('5', (6.301249999999998, 0.125)) 
('10', (21.78000000000001, 3.125)) 
('7', (0.005000000000000009, 0.6049999999999996)) 

(CID, sqrt(v1/n1 + v2/n2)) 
('1', 2.19658826364888) 
('5', 2.5350049309616733) 
('10', 4.990490957811667) 
('7', 0.7810249675906652) 

(CID, (AD_MEAN, NCI_MEAN)) 
('7', (1.0, 5.5)) 
('5', (7.75, 5.3)) 
('10', (13.5, 6.0)) 
('1', (3.0, 5.0)) 

(CID, (AD_MEAN - NCI_MEAN)) 
('7', -4.5) 
('5', 2.45) 
('1', -2.0) 
('10', 7.5) 

(CID, (NUMER, DENOM)) 
[Stage 100:===================================================> (30 + 2)/32]('10', (7.5, 4.990490957811667)) 
('5', (2.45, 2.5350049309616733)) 
('7', (-4.5, 0.7810249675906652)) 
('1', (-2.0, 2.19658826364888)) 

それは(右にスクロール)時には悪化します:

$ spark-submit main.py 
17/04/28 11:36:23 WARN Utils: Your hostname, Pandora resolves to a loopback address: 127.0.1.1; using 146.95.36.193 instead (on interface wlp3s0) 
17/04/28 11:36:23 WARN Utils: Set SPARK_LOCAL_IP if you need to bind to another address 
17/04/28 11:36:24 WARN NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable 
[Stage 0:>               (0 + 2                   [Stage 32:=============================>       (4 + 4[Stage 37:>               (0 + 0[Stage 35:=====>   (4 + 2)/12][Stage 37:>     (0 + 0[Stage 35:===========>  (8 + 4)/12][Stage 37:>     (0 + 0[Stage 37:=======>             (1 + 3[Stage 37:=============================>       (4 + 0[Stage 36:========>  (13 + 4)/24][Stage 37:=========>  (4 + 0[Stage 36:==============> (21 + 3)/24][Stage 37:=========>  (4 + 1[Stage 37:====================================>      (5 + 3[Stage 38:===================================>     (20 + 4)[Stage 38:====================================================> (30 + 2)                   SORTED (t-value, CID) 
[(-5.761659596980321, '7'), (-0.9105029072119708, '1'), (0.9664675480810896, '5'), (1.5028581483070664, '10')] 

答えて

2

あなたは

  • spark.ui.showConsoleProgress = Falseの

または

を設定することで無効にできいずれか
  • INFOよりも高いlog4j.propertiesの減少のログレベルに、すなわちERROR

に関連するスパークjiras:

spark.ui.showConsoleProgressがあるため、スパークに常にでしたバージョン1 .2しかし、スパーク2.2でのみ文書化されます。

+0

spark変数はSparkContextですか? SparkSession.builder()。getOrCreate()から作成されますか? – juanpscotto

関連する問題