2017-03-06 13 views
1

私は人が(login_idによって)1年間にわたってプログラムにログインした回数を数える次のコードを作成しました。Countとgroupby in Python

data1.query("'2015-12-01' <= login_date <= '2016-12-01'").groupby(['employer_key','account_id']).size().reset_index().groupby(['employer_key','account_id'])[[0]].count() 

出力は次のようになります。

employer_key account_id # times logged in 
Apple   X1    1 
Google   Y5    2 
Facebook   X3    4 
Apple   X2    2 
Facebook   Y2    1 

私は多くのアカウントは、個々の雇用を超えるためにログイン方法を決定することができるように、それぞれ別々のemployer_keyためaccount_idsの数をカウントしたいです1年間の期間。私はこれが動作する必要がありますね

employer_key user_logins 
Apple   2    
Google   1    
Facebook   2    
+0

どのように多くの*ユニーク*アカウント

出力がうまくいけば、このようになりますか? –

+0

私の実際のデータセットには何千もあります。 – PhishFood

+0

いいえ、私の質問は、あなたが雇用者1人あたりのユニークユーザー数を数えたい場合です。私はあなたのデータがすでにその列にユニークな 'account_id'しか持たないかもしれないと思うので、それは疑問点かもしれません。 –

答えて

1

data.groupby(['employer_key','account_id']).count().\ 
      unstack().sum(axis=1).astype(int) 
#employer_key 
#Apple  2 
#Facebook 2 
#Google  1 
#dtype: int64 
+0

上記のコードは、提供したコードにどのように組み入れられていますか?コードを実行すると、指定した1年間ではなく、すべての日付のデータが返されます。私はあなたのコードに1年間の期間を統合する方法がわかりません。ありがとう! – PhishFood

+1

私の答えは、最初の出力ブロックに示されているように、コードの出力に適用されます。 – DyZ

+0

2つのコードをリンクする具体的な部分は何ですか?助けてくれてありがとう、本当に感謝しています。 – PhishFood