1
ネットワークトラフィックで.csvを読み込み、インデックスのような時間を入れます。私は「ipdst protoとtime」のグループに数えます。アウトpandas groupby freq 5s
...
df['time'] = pd.to_datetime(df['time'])
df.index = df['time']
data = df.copy()
data_group = pd.DataFrame({'count': data.groupby(['ipdst', 'proto', data.index]).size()}).reset_index()
data_group
:
ipdst proto time count
10.3.20.102 HTTP 2017-03-20 17:08:56 1
10.3.20.102 HTTP 2017-03-20 17:08:57 1
10.3.20.102 HTTP 2017-03-20 17:08:58 1
10.3.20.102 HTTP 2017-03-20 17:08:58 1
10.3.20.102 TCP 2017-03-20 17:08:59 3
今私は5秒の時間周波数で繰り返されているもの "ipdst" と "プロトコル" を参照します。アウト次のように:
ipdst proto time count
- - 2017-03-20 17:08:50 0
10.3.20.102 HTTP 2017-03-20 17:08:55 4
10.3.20.102 TCP 2017-03-20 17:08:55 4
- - 2017-03-20 17:09:00 0
私はエラーを次のようしている:TypeError例外:__init __()を使用しているパンダのバージョンは何 – Wen
「on」に予期しないキーワード引数を得ましたか。バージョン0.19.0の新しい 'on'パラメータ –
私は長い間あなたのパンダを更新していません。ありがとうございます。 – Wen