2012-01-16 3 views
0

私は前月のファイルで5分ごとにnetflowデータを持っています。このトラフィックのパケットプロファイルを作成したいと思います。 1つのパケットフロー、2つのパケットフローなどのパーセンテージ表現が必要です.1つのパケットフロー、1〜100のパケットフロー、100以上のカテゴリでそれを行うことが可能です。それほど重要ではありません。しかし、私の質問はそれをどうやって行うのかです。一緒に追加できないデータのパーセンテージ表現を行うにはどうすればよいですか?何かがすべてのファイルのパーセンテージ表現をし、それから平均のいくつかのタイプを行うような何か?netflowからのパケットプロファイル

答えて

0

「一緒に追加できません」とはどういう意味ですか?実際には、-R expr/dir/file1:file2ファイル1からファイル2にすべてのファイルを読み取るを参照すると、nfdumpでそれを行うことができます。図表番号

nfdump -R /yournetflowfolder/nfcapd.201204051609:nfcapd.201204051639 

は、NetFlow情報を16:09から16:39まで集めます。次に、そのデータに必要なクエリを実行できます。

0

ヒストグラムを記述しているように聞こえます。生のカウントで記述するサイズの「ビン」を作成します。ビンのカウントの合計は、セッションの合計数です。トータルトラフィックの割合を取得するには、各ビンを合計フロー数で割って正規化します。

したがって、最初のビンが<個のパケットフローと100個以上のパケットフローを持つすべてのセッションの数である2ビンのヒストグラムを作成すると(ギャップや重なりがないことに注意してください)、前者では30フロー、後者では60フローになります。フローの総数は90であり、フローのうち33%は100パケット未満です。

複数のファイルを扱う場合、トリックは常に同じビン区切りを使用し、生のカウントをできるだけ長く保存して処理し、最後のステップとして%sを派生させることです。ビンが同じものを意味するのであれば、ヒストグラムを一緒に追加することができます。結果を正規化すると、すべてのビンに対して、すべてのファイルの合計パーセントが求められます。ファイルを追加する必要がある場合は、新しいデータがあるときに再正規化できるように生のカウントを追跡してください。

これはMatlabのようなツールで簡単に行うことができますが、これらのツールの多くは非常に親切に自動的にビン幅を決定するので注意してください。したがって、1つのファイルのヒストグラムには、ビン{x < 100,100 < = x < 200、x> = 200}と別のファイル{x < 90、90 < = x < 180、x> = 180}とビン結果を一緒に追加することはできません。

関連する問題