0
PySparkのpandas info()メソッドと同等のメソッドがありますか?Pyspark:pandas info()と同等のメソッドはありますか?
私のような、PySparkにおけるデータフレームについての基本的な統計を獲得しようとしています:パンダの列と行の 数 数ヌルのデータフレームの サイズ
情報()メソッドは、これらすべての統計情報を提供します。
PySparkのpandas info()メソッドと同等のメソッドがありますか?Pyspark:pandas info()と同等のメソッドはありますか?
私のような、PySparkにおけるデータフレームについての基本的な統計を獲得しようとしています:パンダの列と行の 数 数ヌルのデータフレームの サイズ
情報()メソッドは、これらすべての統計情報を提供します。
データフレームについての型情報を把握するために、あなたはまた、ドキュメントからメソッドを記述を見ている可能性が要約統計についてはdf.schema
spark.read.csv('matchCount.csv',header=True).schema
StructType(List(StructField(categ,StringType,true),StructField(minv,StringType,true),StructField(maxv,StringType,true),StructField(counts,StringType,true),StructField(cutoff,StringType,true)))
を試みることができます。
printSchema()は、同じ情報の読みやすいバージョンを提供します。 – RyanW