2017-02-08 8 views
1

データフレーム内の列の値を見ると、ユーザーデータ入力エラーのために同じカテゴリが誤って入力されていることがわかります。私のデータフレームのためにPython pandasが列の値を置き換えます

私はこのコードを使用:

df['column_name'].value_counts() 

出力:物語のため

Targeted 523534 
targeted 1 
story  25425 
story  2 
multiple 2524543 

、私はスペースがあると思いますか?

私はTargetedで置き換えようとしています。

df['column_name'].replace("targeted","Targeted") 

しかし、何も起こっていない、私はまだ同じ値のカウントを取得します。

+0

はあなた 'DF [ 'COLUMN_NAME' でした] .replace( "targeted"、 "Targeted")。value_counts() '? – Zero

答えて

1

はい、開始の空白があるようです。

最初にしてSeries.replaceまたはSeries.str.replacestr.stripが必要です:

df['column_name'] = df['column_name'].str.strip().replace("targeted","Targeted") 

df['column_name'] = df['column_name'].str.strip().str.replace("targeted","Targeted") 

別の可能な解決策を小文字にすべての文字を変換である:

df['column_name'] = df['column_name'].str.strip().str.lower() 
+0

ありがとうございます。このオプションは、最高のdf ['column_name'] = df ['column_name']。str.strip()。replace( "targeted"、 "Targeted") – jeangelj

関連する問題