2017-08-16 70 views
0

PySparkの浮動小数点数のうちn桁(たとえば3)しか表示しません。デフォルトを設定する方法はありますか?実際のデータを四捨五入したくないことに注意してください。PySparkに表示されるデフォルトの桁数を設定するにはどうすればよいですか?

>>> df = sc.parallelize([ ('a', 1), ('b', 2) ]).toDF() 
>>> df.withColumn("x", rand()).show() 
+---+---+------------------+ 
| _1| _2|     x| 
+---+---+------------------+ 
| a| 1|0.7468471761178085| 
| b| 2|0.6189219219244186| 
+---+---+------------------+ 

ありがとう:

以下は、私が持っている、それはあまりにも多くの情報が何であるかを示して!それが唯一の表示のためになら

答えて

1

、あなたはパンダを使用し、float形式を指定することができます

pd.options.display.float_format = '{:,.2f}'.format 
df = sc.parallelize([ ('a', 1), ('b', 2) ]).toDF() 
df.withColumn("x", rand()).limit(20).toPandas() 
関連する問題