2017-06-03 3 views
0
Ad-Slot Id Click Time     Click IP 
0 208878 2017-03-23 18:30:00.059 2405:204:c:3868:f27d:db2c:e2a9:c90c 
1 195915 2017-03-23 18:30:00.107 2405:204:4183:6939:d3c2:bf40:ed47:3a6d 
2 129192 2017-03-23 18:30:00.309 2405:204:900a:5700:cd84:2eec:449e:6af6 
3 195987 2017-03-23 18:30:00.311 27.62.33.203 
4 209078 2017-03-23 18:30:00.523 182.65.23.82 
5 206706 2017-03-23 18:30:00.637 2405:205:1308:f499:b1d1:931a:2266:a738 
6 210917 2017-03-23 18:30:01.136 42.106.17.94 
7 236944 2017-03-23 18:30:01.226 171.61.19.146 
8 195980 2017-03-23 18:30:01.331 2405:204:4088:1b4d::17ac:38ac 

上記のデータがあり、各サイト運営者(広告スロットID)の単位時間(1分、5分、1時間)あたりのクリック数を調べる必要があります。 。単位時間あたりのクリック数を確認する

+0

これまでに何を試みましたか? –

+0

私はローリング機能を試していましたが、私は 'windows'パラメータを理解することができません –

答えて

0

注:テストのためだけに、データスニペットを1秒あたり複数の広告スロットIDに変更しました。だから私の出力はあなたとは異なるでしょう。

データは、スニペット:

Ad-Slot_Id Click Time     Click_IP 
0 208878 2017-03-23 18:30:00.059 2405:204:c:3868:f27d:db2c:e2a9:c90c 
1 236944 2017-03-23 18:30:00.107 2405:204:4183:6939:d3c2:bf40:ed47:3a6d 
2 129192 2017-03-23 18:30:00.309 2405:204:900a:5700:cd84:2eec:449e:6af6 
3 129192 2017-03-23 18:30:00.311 27.62.33.203 
4 236944 2017-03-23 18:30:00.523 182.65.23.82 
5 206706 2017-03-23 18:30:00.637 2405:205:1308:f499:b1d1:931a:2266:a738 
6 129192 2017-03-23 18:30:01.136 42.106.17.94 
7 236944 2017-03-23 18:30:01.226 171.61.19.146 
8 129192 2017-03-23 18:30:01.331 2405:204:4088:1b4d::17ac:38ac 

私はあなたが好き/ 2番目/分あたりのリサンプリング、広告スロットIdでデータフレームをグループ化し、オブジェクトの数をカウントしています:

df = pd.read_clipboard() 
df.index = pd.to_datetime(df['Click'] + ' ' + df['Time']) 
resampletime = 's' 
for theid, thedf in df.groupby(by=['Ad-Slot_Id'], axis=0): 
    print theid 
    print thedf.resample(resampletime, how='count')['Ad-Slot_Id'] 

これはあなたがあなたのやり方に乗るのを助けるはずです。

関連する問題