私はgroup_、vals_、dates_という列を持つ次の構造のデータフレームを持っています。Python - Pandas - Groupbyのカラム値の条件付きで
私はgroup_でgroupby操作を実行し、その後、各グループに対して日付の条件付きの統計を出力したいと考えています。例えば、関連付けられた日付がある日付よりも低いグループ内のすべてのvalの平均。
私は
df_.groupby(group_).agg(lambda x: x[x['date_']< some_date][vals_].mean())
を試みたが、これは失敗します。私はxがデータフレームではなくシリーズであるからだと信じています。これは正しいです?私がgroupbyでここで達成しようとしていることを達成することは可能でしょうか?
'df_.groupby(group _).gg(lambda x:x.loc [x ['date _']
jezrael
これを試す前に、xはデータフレームの代わりにすべての型のシリーズであることに気付きました。これはここに期待されていますか? – clog14
うん、そうじゃなくて、 'agg'の代わりに' apply'を試してください。 – jezrael