は、私がデータフレームがあるとパンダ:グループオブジェクトに異なるアイテムに異なる機能を適用します:Pythonは、次のように
In [1]: test_dup_df
Out[1]:
exe_price exe_vol flag
2008-03-13 14:41:07 84.5 200 yes
2008-03-13 14:41:37 85.0 10000 yes
2008-03-13 14:41:38 84.5 69700 yes
2008-03-13 14:41:39 84.5 1200 yes
2008-03-13 14:42:00 84.5 1000 yes
2008-03-13 14:42:08 84.5 300 yes
2008-03-13 14:42:10 84.5 88100 yes
2008-03-13 14:42:10 84.5 11900 yes
2008-03-13 14:42:15 84.5 5000 yes
2008-03-13 14:42:16 84.5 3200 yes
は私がグループに時間14:42:10
で重複データを欲しいとexe_price
とexe_vol
に異なる機能を適用します(例: exe_vol
を合計し、exe_price
という計算量加重平均を計算します)。私はグループに重複したインデックスを
In [2]: grouped = test_dup_df.groupby(level=0)
を行い、その後、最初または最後の行のいずれかを取得するためにfirst()
またはlast()
機能を使用しますが、これは私が欲しいものは本当にないことを知っています。
異なる列の値にグループ化して別の(私が書いた)関数を適用する方法はありますか?あなたができるnumpyのひどくpandas
に精通し、しかし純粋でない
これは私に2つの別々のデータフレームを与えることはないでしょうか?私はそれをgrouped.first()またはgrouped.last()の出力に似ている1つのデータフレームに入れたいと思います。私は何かが不足しているかもしれない? – kunitomo