をnp.nanする正規表現を使用して値を置き換えます。たとえば私は以下のようにデータフレーム持って
data1 = {"first":["alice", "bob", "carol"],
"last_huge":["foo", "bar", "baz"]}
df = pd.DataFrame(data1)
を、私は「A」に、すべての文字「O」を置換したい:
その後、私はありません
df.replace({"o":"a"},regex=True)
Out[668]:
first last
0 alice faa
1 bab bar
2 caral baz
私は必要なものを返します。しかし
、私はnp.nan
に「O」を交換したいとき、それはnp.nan
に文字列全体を変更します。 パンダの文書から説明はありますか?私はsource codeを通していくつかの情報を見つけることができます。
詳細情報:(それはnp.nan
に文字列全体を変更します)
df.replace({"o":np.nan},regex=True)
Out[669]:
first last
0 alice NaN
1 NaN bar
2 NaN baz
結果は何ですか? –
@ShiheZhang欲望の結果はありません。ちょうど+正規表現にこのような振る舞いがあると、私はこれに関連する文書を見つけることができません。ソースコードを読むだけです。 – Wen
あなたは 'pandas'のどのバージョンを使用していますか?これは実際には、文字列以外のオブジェクトで発生しますが、私が知る限り、 'object()'を渡してみてください。 –