-3

PySparkでピボットデータフレームを表示/表示/印刷できません。データフレームはピボットされているようですが、show()を使用しようとするとAttributeError: 'GroupedData' object has no attribute 'show'と表示されます。PySark、Pysparkでピボットデータフレームを表示するには?

はここだけgroupBy()のように、コード

meterdata = sqlContext.read.format("com.databricks.spark.csv").option("delimiter", ",").option("header", "false").load("/CBIES/meters/") 

metercols = meterdata.groupBy("C0").pivot("C1") 
metercols.show() 


Output: Traceback (most recent call last): File "/tmp/zeppelin_pyspark-8003809301447367155.py", line 239, in eval(compiledCode) File " ", line 1, in AttributeError: 'GroupedData' object has no attribute 'show' 

答えて

0

pivot()方法はGroupedDataオブジェクトを返します。以前は集計関数(sum()、さらにはcount()など)を使用せずに、GroupedDataオブジェクトにshow()を使用することはできません。

詳細については、this articleまたはPySpark documentationを参照してください。

関連する問題