2017-06-07 8 views
0

PySparkのpandas info()メソッドと同等のメソッドがありますか?Pyspark:pandas info()と同等のメソッドはありますか?

私のような、PySparkにおけるデータフレームについての基本的な統計を獲得しようとしています:パンダの列と行の 数 数ヌルのデータフレームの サイズ

情報()メソッドは、これらすべての統計情報を提供します。

答えて

0

データフレームについての型情報を把握するために、あなたはまた、ドキュメントからメソッドを記述を見ている可能性が要約統計についてはdf.schema

spark.read.csv('matchCount.csv',header=True).schema 

StructType(List(StructField(categ,StringType,true),StructField(minv,StringType,true),StructField(maxv,StringType,true),StructField(counts,StringType,true),StructField(cutoff,StringType,true))) 

を試みることができます。

+0

printSchema()は、同じ情報の読みやすいバージョンを提供します。 – RyanW

関連する問題