を使用Pyspark null( '')を文字列で置き換える方法が見つかりましたが、データフレームのすべてのセルが文字の間にこの文字列で埋められます。おそらく、システムは空でないセルの文字列の間にヌル( '')を見ます。Pyspark-値が空の文字列を入力する
これらは初期データフレームの値は以下のとおりです。これを使用した後
+-----------------+-----+
|CustomerRelStatus|count|
+-----------------+-----+
| Ανοιχτος | 477|
| Κλειστος | 68|
| 'γνωστο | 291|
| | 1165|
+-----------------+-----+
:
newDf = df.withColumn('CustomerStatus', regexp_replace('CustomerRelStatus', '', '-1000'))
それが返されます。
+--------------------+-----+
| CustomerRelStatus |count|
+--------------------+-----+
|-1000Α-1000ν-1000...| 477|
|-1000Κ-1000λ-1000...| 68|
|-1000ʼ-1000γ-1000...| 291|
| -1000| 1165|
+--------------------+-----+
は、他の方法はありますか?
あなたが(HTTPS [答えを受け入れる]する必要があり@VickyKです。あなたがあなたの問題を解決するのに役立つのであれば。 – Prem