私はパンダのバージョンが '0.19.2'のPython3を使用しています。パンダの文字列のローリング合計
私は次のようにDFパンダを持っている:
chat_id line
1 'Hi.'
1 'Hi, how are you?.'
1 'I'm well, thanks.'
2 'Is it going to rain?.'
2 'No, I don't think so.'
私は「chat_id」でグループ化したい、次を得るために「行」上のローリング合計ような何かを:
chat_id line conversation
1 'Hi.' 'Hi.'
1 'Hi, how are you?.' 'Hi. Hi, how are you?.'
1 'I'm well, thanks.' 'Hi. Hi, how are you?. I'm well, thanks.'
2 'Is it going to rain?.' 'Is it going to rain?.'
2 'No, I don't think so.' 'Is it going to rain?. No, I don't think so.'
私はdf.groupby( 'chat_id')['line']と考えています。cumsum()は数値列に対してのみ機能します。
私はdf.groupby(by = ['chat_id']、as_index = False)['line']を試してみましたが、完全な会話のすべての行のリストを取得するにはapply(list)そのリストを展開して「ローリングサム」スタイルの会話の列を作成する方法を理解できません。私にとって
興味深いです。 'cumsum'はSeriesで呼び出すと動作しますが、groupbyオブジェクトで呼び出されるとエラーが発生します。 – ayhan