0
PythonのPandasでデータセットをインポートしていますが、残念ながらクリーニングが必要です。インポート後、引用符とスペースを2つの列(alpha2
とalpha3
)ですべて削除する必要があります。これは私がこれを行う方法を現在:パンダでCSVファイルをインポート中にデータを効率的にクリーニング
# Add alpha2 country codes to custom dataset to normalize data
country_codes = pd.read_csv('datasets/country_codes.csv').rename(columns = {'Alpha-2 code':'alpha2', 'Alpha-3 code':'alpha3'})
# Remove commas and spaces from dataset
country_codes['alpha2'] = country_codes['alpha2'].str.replace('"', '')
country_codes['alpha2'] = country_codes['alpha2'].str.replace(' ', '')
country_codes['alpha3'] = country_codes['alpha3'].str.replace('"', '')
country_codes['alpha3'] = country_codes['alpha3'].str.replace(' ', '')
私はいくつかの簡単なコマンドの5つのルールを必要とするので、これは少し醜いです。これはより少ないコードでより効率的に行うことができますか?
次のようにあなたがregex
で
df.replace
を使用することができます
inplace =連鎖式のTrueは、慣習的ではなく、ときどきしか動作しない場合があります。単に新しい値を返すだけです – Jeff