としてnumpyのアレイとパンダのデータフレームを減らすには、私は、次の構造を有するpandas.DataFrame
を有する:GROUPBYおよびエントリ
>>> data
a b values
1 0 [1, 2, 3, 4]
2 0 [3, 4, 5, 6]
1 1 [1, 3, 7, 9]
2 1 [2, 4, 6, 8]
('values'
をnumpy.array
の種類を有します)。私がしたいのは、データを列'a'
でグループ化し、値のリストを結合することです。値の順序が問題ではないこと
>>> data
a values
1 [1, 2, 3, 4, 1, 3, 7, 9]
2 [3, 4, 5, 6, 2, 4, 6, 8]
注: 私の目標は、次のようになってしまうことです。これをどのように達成するのですか?私は何かのような何かについて
>>> grps = data.groupby(['a'])
>>> grps['values'].agg(np.concatenate)
しかし、これはKeyError
で失敗します。私はこれを達成するためのパンダ的な方法があると確信しています - しかし、どのように?おかげさまで
結果の列の名前が '' values''であることをどのように達成できますか? – rammelmueller
@rammelmullerあなたはaについて何をしたいですか?b?もうやめろ? –
'' b''はデフォルトで削除されますが、 '' a''はそのままにして同じ名前にする必要があります。 – rammelmueller