2016-05-25 20 views
3

の文字列を結合:パンダ - 私はこのようなデータフレームを持って行

id  text 
    1   DM,HTN,Enlarged prostate 
    2   hypertensive and on regular treatment LBP 
    3   DM,HTN,Enlarged prostate 

ID 2のテキストを組み合わせた:

id  text 
    1   DM,HTN,Enlarged prostate 
    2   hypertensive and on regular treatment 
    2   LBP 
    3   DM,HTN,Enlarged prostate 

私はこのように同じIDのテキストを組み合わせたいです。 これをどのように達成できますか?どんな助けもありがとう。

答えて

1

を行うために機能することで、グループを使用することができます。最後reset_index

grouped_df = df.groupby("id")['text'].apply(' '.join).reset_index() 
print (grouped_df) 
    id          text 
0 1     DM,HTN,Enlarged prostate 
1 2 hypertensive and on regular treatment LBP 
2 3     DM,HTN,Enlarged prostate 
+0

詳細をありがとう!機能の確認 –

+0

どのように機能しますか? – jezrael

+0

それは完全に働いた。このコードではなく、データフレームを取得したので、他の答えよりも優れているかもしれません。私はいくつかの仕事を保存し、それを感謝します。 –

3

あなたがgroupbyapply機能joinを使用することができ、この

grouped_df = df.groupby("id").apply(lambda x: "%s" % ' '.join(x['text'])) 
+0

は完全に機能しました。どうもありがとう! –

関連する問題