2016-10-26 31 views
3

データフレームに「Num_of_employees」という名前の列があります。値は50-100,200-500などです。データには値がほとんどないという問題があります。従業員数が1〜10のいずれの場合でも、データには10-Janと表示されます。また、値が11-50の場合は、Nov-50となります。パンダを使ってこの問題を解決するにはどうすればいいですか?Pandasを使用してデータフレーム列の特定の値を置き換えます

答えて

5

この種のクリーンな構文は、「検索と置換」あなたは大規模なデータセットを持っている場合、この手動でのように置き換える使用することは不可能かもしれない

df.Num_of_employees = df.Num_of_employees.replace({"10-Jan": "1-10", 
                "Nov-50": "11-50"}) 
+0

として、辞書を使用しています。 –

+0

@JoeR Right!大規模なデータに実装できる方法はありますか? – ComplexData

+1

私はこれを100,000,000行以上実行し、数秒で終了しました。 IMO、これがあなたの解決策です。 – piRSquared

関連する問題