'df'がデータフレームオブジェクトであり、 'ca'が変数の1つであるとします。Pandas Dataframeの欠損値のFilllが正しくない
>>> df.ca.value_counts()
0.0 176
1.0 65
2.0 38
3.0 20
? 4
Name: ca, dtype: int64
ご覧のとおり、4つの欠損値があります。私はそれらに記入したい。以下のコードを使用:
>>> df.loc[df.ca == '?', 'ca'] = 0.0
0.0 176
1.0 65
2.0 38
3.0 20
0.0 4
Name: ca, dtype: int64
なぜ5つのユニークな値がありますか? 5行目を1行目にマージしたい、つまり
0.0 176 + 4 = 180
1.0 65
2.0 38
3.0 20
どうすれば修正できますか?