私は以下のデータセットを持っており、いくつかのnull値を含んでいます。sparkのfillnaを使用してnull値を置き換える必要があります。スパークfillNaがnull値を置き換えない
DATAFRAME:
df = spark.read.format("com.databricks.spark.csv").option("header","true").load("/sample.csv")
>>> df.printSchema();
root
|-- Age: string (nullable = true)
|-- Height: string (nullable = true)
|-- Name: string (nullable = true)
>>> df.show()
+---+------+-----+
|Age|Height| Name|
+---+------+-----+
| 10| 80|Alice|
| 5| null| Bob|
| 50| null| Tom|
| 50| null| null|
+---+------+-----+
>>> df.na.fill(10).show()
私はNAが同じデータフレームが再び登場変わっdosen'tそれを値あげます。
+---+------+-----+
|Age|Height| Name|
+---+------+-----+
| 10| 80|Alice|
| 5| null| Bob|
| 50| null| Tom|
| 50| null| null|
+---+------+-----+
新しいデータフレームを作成し、その値をデータフレームに保存しようとしましたが、結果は変更されていません。
>>> df2 = df.na.fill(10)
null値を置き換える方法は? fill naを使用して可能な方法を教えてください。 ありがとうございました。
どのようにDataFrameを作成し、そのスキームを印刷できますか? – eliasah
'df = spark.read.format(" com.databricks.spark.csv ")オプション(" header "、" true ")。load("/sample.csv ")'これは私のdfです。 –
あなたの質問をdf.printSchema()で更新し、コメントとして追加しないでください。 – eliasah