最近、あるデータフレーム列の多くのカテゴリをいくつかの上位のサブカテゴリにマップする必要がありました。私はこれを達成するためのより簡潔な方法が 以下であるかどうか疑問に思っていました。カテゴリの列の多くの値を変換するPython
df_to_map = pd.DataFrame({"cities": [ 'Thessaloniki', 'Geel', 'Bern', 'Dublin', 'Hanover' ,
'Gurabo','Buenos Aires','Manati' ,'Panama', 'Lima',
'Washington', 'Huston', 'Kairo']})
Aggregate_cities={
'Thessaloniki':'Europe', 'Geel':'Europe', 'Bern':'Europe', 'Dublin':'Europe', 'Hanover':'Europe',
'Gurabo':'Latin America','Manati' :'Latin America', 'Panama':'Latin America', 'Lima': 'Latin America' ,'Buenos Aires': 'Latin America',
'Washington':'North America', 'Huston':'North America', 'Boston': 'North America'
}
df_to_map['continent']= df_to_map.cities.map(Aggregate_cities)
;) – jezrael
が、例えばを置くことも可能であろうがすべてのヨーロッパの都市を1つのリストにまとめました。このようなものAggregate_cities = {[Thessaloniki、 'Geel'、 'Bern'、 'Dublin'、 'Hanover']: 'Europe'} –