2016-07-07 12 views
1

クラスタ化された棒グラフがあり、各クラスタで異常値を見つけたいとします。これは例に対して説明しやすいため、クラスタ化された棒グラフが「正規化」されているため、外れ値が表示される

enter image description here

ここでは、エラーコードの数を持っている(X軸:コード、Y軸:数)とクラスタは、たとえば、これらのエラーが記録されている個々のマシンです。 1001がこれらすべてのマシンに束ねられ、897がそれほど多くないことがわかります。私は、エラーコードクラスターごとに、特定のマシンが他のマシンと比べてアウトライヤー(高)である場所を見つけたいと思っています。

これは私の目で簡単に認識できるパターンです...しかし、多くのエラー1001が記録され、他のすべてのエラーコードに対して線形のY軸でプロットされているということは、897または176は斑点が出にくい。

So:それぞれのクラスタを「正規化」する方法があります。小さいカウントのクラスタでは、Y軸の多くを占めるようにカウントが拡張/拡張されますか?

+0

の外にある場合、あなたはそこから違い

search ... | stats count by host error | eventstats avg(count) as error_avg by error | eval diff = (count-error_avg)/error_avg*100 | chart max(diff) as diff by host error 

をグラフ化すると、フィルタリングすることができ、最初にすべてのホスト間で平均エラー数を確立することを試みることができますhttp://stats.stackexchange.com/、これは良いでしょう。 – xan

+0

私はデータ視覚化がそのスコープの一部であることに気付きませんでしたが、今は感謝しています! – davidbak

+0

さらに、私はY軸を対数スケールに設定することを考えていたので、それはかなりうまく機能しました。私自身の答えでこれに答えるか、それを削除するのか、それとも何をするのかは分かりません。 – davidbak

答えて

0

あなたは、diffは私がクロス検証済みだと思い一定割合

関連する問題