2016-06-16 14 views
1

私は特にPythonとpandasの新機能です。私はIDの変数が他の列と一致するデータフレームの1つの列からすべての文字列を連結したいという不規則な形状変更問題を抱えています。 idによって、実行する必要がある連結の数が異なる可能性があるため、不規則な再形成の問題です。reshape python concatenate text不規則なデータフレーム

したがって、たとえば:

import pandas as pd 
import numpy as np 
df = pd.read_csv('sample.txt') 
print df 

    id text 
0 1 ABC 
1 1 BCD 
2 2 CDE 
3 2 DEF 
4 2 EFG 
5 3 FGH 

私は再形成するidを使用したい、とidマッチケースのためにすべてのtextを連結し、このようなものになる: プリント(df_new):

joinを集約して
id   text 
0 1  ABC BCD 
1 2 CDE DEF EFG 
2 3   FGH 

答えて

4

使用groupby

print (df.groupby('id')['text'].apply(' '.join).reset_index()) 
    id   text 
0 1  ABC BCD 
1 2 CDE DEF EFG 
2 3   FGH 
+0

EKLこの回答があなたの問題の解決に役立ったと思われる場合は、緑色のチェックマークをクリックして「受け入れ済み」とマークしてください。これはコミュニティが未回答の質問に焦点を当てるのに役立ちます。 – Lahiru

関連する問題