2016-05-28 8 views
2

の行に私が処理しなければならないCSVファイル(「data.csv」)の一部をマージ:私はデータフレームの中に、このファイルをインポートするには次のようになり、データフレーム

parent_id,parent_name,Type,Companyname,Custsupid,Streetaddress 
3,Customer,,,C0010, 
3,Customer,A,,, 
3,Customer,,ACE SYSTEMS,, 
3,Customer,,,,Straat 10 
7,Customer,,,Q8484, 
7,Customer,B,,, 
7,Customer,,XYZ AUTOMAT,, 
7,Customer,,,,Laan 99 

。DF = pd.read_csv( 'data.csv')fillna( '')

これは、その結果:

------------------------------------------------------------------ 
| |parent_id|parent_name|Type|Companyname|Custsupid|Streetaddress| 
------------------------------------------------------------------ 
|0|3  |Customer | |   |C0010 |    | 
|1|3  |Customer |A |   |   |    | 
|2|3  |Customer | |ACE SYSTEMS|   |    | 
|3|3  |Customer | |   |   |Straat 10 | 
|4|7  |Customer | |   |Q8484 |    | 
|5|7  |Customer |B |   |   |    | 
|6|7  |Customer | |XYZ AUTOMAT|   |    | 
|7|7  |Customer | |   |   |Laan 99  | 
------------------------------------------------------------------ 

しかし、私はで終わるしたいもの、datafrですこのようになりますAMEは:

------------------------------------------------------------------ 
| |parent_id|parent_name|Type|Companyname|Custsupid|Streetaddress| 
------------------------------------------------------------------ 
|0|3  |Customer |A |ACE SYSTEMS|C0010 |Straat 10 | 
|1|7  |Customer |B |XYZ AUTOMAT|Q8484 |Laan 99  | 
------------------------------------------------------------------ 

私はすでにdf.groupbyなどで試してみましたが、私は望ましい結果を生成することはできません。

パンダのデータフレームでこれを実現する方法はありますか?

答えて

2
In [37]: df.groupby(['parent_id', 'parent_name']).sum() 
Out[37]: 
         Type Companyname Custsupid Streetaddress 
parent_id parent_name           
3   Customer  A ACE SYSTEMS  C0010  Straat 10 
7   Customer  B XYZ AUTOMAT  Q8484  Laan 99 

sumが一緒に文字列を追加し、従って、これは、非空の文字列に空の文字列を追加すると、非空の文字列を返すという事実に依存しています。

関連する問題