1
にのみ選択された列の値を結合する効率的な方法私は、単一の行にそれを平らにするように、私はIDによってグループをしたいようなパンダ:グループ化されたデータフレーム
LAST_MOD_DATE ID TITLE TXT_ID TXT
0 1486047205463 2 TITLE-2 7 ABC
1 1486047205463 2 TITLE-2 5 XYZ
2 1486047205463 2 TITLE-2 6 MNQ
ことDFを有しています。異なる値のTXT_ID
とTXT
のフィールドは、コンマ区切りの値で1つに結合されます。だから、以下のような何か:
ID
2 1486047205463 TITLE-2 7, 5, 6 ABC, XYZ, MNQ
私はちょうど
df.groupby('ID')['TXT'].apply(lambda x:', '.join(x))
によって単一の列を取得することができていますしかし、単にながら、私は選択いくつかの列に参加できるように全体のDFにそれを行う方法同じグループ内の他の列の上位値を選択します。今は、値を集合として集計し、次にいくつかの列に対して集合を拡張することでそれをやっています。しかし、これは非常に効率的ではないようです。
ああ、持っています。ありがとう – Fizi