を行った後、私はTTMという名前の、次のデータフレームがあります。、GROUPBYグループ化されたカラムは
usersidid clienthostid eventSumTotal LoginDaysSum score
0 12 1 60 3 1728
1 11 1 240 3 1331
3 5 1 5 3 125
4 6 1 16 2 216
2 10 3 270 3 1000
5 8 3 18 2 512
私は
ttm.groupby(['clienthostid'], as_index=False, sort=False)['LoginDaysSum'].count()
を行うと、私は思っていたでしょうが、私は(私が期待したものを取得します「比」という名前の新しいラベルの下にあるとの結果):
clienthostid LoginDaysSum
0 1 4
1 3 2
しかし、私は
を行いますttm.groupby(['clienthostid'], as_index=False, sort=False)['LoginDaysSum'].apply(lambda x: x.iloc[0]/x.iloc[1])
私が取得:
0 1.0
1 1.5
- なぜラベルは行きましたか?私はまだ、「clienthostid」というグループ化されたニーズが必要です。また、ラベルの下にも適用結果が必要です
- 時々私がgroupbyを実行すると、他の列のいくつかが表示されることがあります。いつか滞在しますか?私はそれらのことを行う行方不明のフラグがありますか?
- 私が与えた例では、結果を数えたとき、ラベル 'LoginDaysSum'に結果が表示されましたが、その代わりに結果の新しいラベルを追加する理由はありますか?
はgroupby
は2つの可能な解決策になった後の戻りDataFrame
について
私はOPがバグを発見したと思います。 – chrisaycock
@chrisaycock - それはバグではないようです。 – jezrael
ニースの説明+1 – ade1e