2011-02-04 6 views
2

busyboxとptpdを実行する4つの同一のルータA、B、C、Dがある場合を考えてみましょう。 AとBはケーブル1で接続されています。 CとDはケーブル2で接続されています。私は、ルータAとCにUDPを介して非常に小さなパケットを対向ルータに送信する小さなCプログラムを持っています。そして、パケットが送信された時間とpcapそれは反対側に到着し、これらのテストの数千の平均と偏差を計算します。統計的に有意な遅延変動とは何ですか?

これらのケーブルが異なるかどうかをどのように確認できますか? 明らかに1つが500μsで、もう1つが10msであれば、それらは異なっています。しかし、1つの結果が標準偏差8で平均200μsであり、他の結果が平均210μsと標準偏差10を持つ場合はどうでしょうか?違いはありますか?これをテストするにはどのような計算を行う必要がありますか?そして、より技術的なノートでは、レイテンシの予想される変動はどのくらいですか?

中間スイッチ、ハブ、ルータなどがレイテンシと変動性を増すことは理解していますが、1本のケーブルで直接接続されている場合、通常の分散は何ですか?

編集:ポイントを明確にする - これは単なる統計的な質問ではありません。私はt検定を使用して差の確率を計算することができます(ありがとう)が、ネットワーク機器のさまざまな品質に起因する違いがどれくらいあるかも知りたいと思います。例えば、2つの手段の平均が208.4と208.5の場合、私は、t検定が何であれ、ケーブルは同じであり、その差は試験機から来ると考えています。または私は間違っていますか?ケーブルはしばしば少量で変化しますか?私は知らない - レイテンシの間の標準的な差異は何ですか?ケーブルの違いと機器を区別するためにはどのようなテストが必要ですか? (私はケーブルを切り替えることができません)

+1

プログラミング関連ではありません - おそらくhttp://serverfault.comや数学/統計サイトに属していますか? –

+1

... like http://stats.stackexchange.com/ –

+0

私はそれを削除してそこに再掲載すべきですか? – Benubird

答えて

0

2サンプルのt検定が必要です。あなたは、あなたが心配している典型的な分散についての仮定を行う必要はなく、テストに組み込まれています。適切なWikiページhereを見つけてください。しかし、統計的に異なるとは必ずしも経済的に異なるとは限りません。 2台のルータ間のレイテンシタイムは実際に異なっていても問題はありませんか?あなたの状況について何も知らずには言い難いですが、統計的な雑草ではあまりにも遠くになることには注意してください。

3

まず、統計的仮説検定に関する初心者が必要です。

質問に答えるにはいくつかの方法がありますが、最も古典的なのは、観測されたレイテンシが実際の変数であると考えることです。それぞれのケーブルの挙動(ケーブルの場合はCと呼ぶ)と説明できないランダムなコンポーネント(ランダムな変動など)を考慮に入れることを忘れてしまったことがあります。

その後、あなたはケーブルABのために、一連の観察を行います、そして、あなたのモデルは次のとおりです。

T1_i = C1 +あなたはケーブルの寄与が固定されたままと信じてE1_i

ランダム変数E1のみが変化している。

また、ケーブルCDのための一連の観察を行います、そして、あなたのモデルは次のとおりです。

T2_i = C2 + E2_i

あなたはケーブルの寄与が固定されたままとだけ信じて

確率変数E2が変化している。

今、あなたはかなり解決されています。体系的な影響を排除することができるので、E1とE2は実際に変動します。これらの条件下では、それらが正常(ガウス)であると仮定できます。

このモデルを使用すると、独立した2サンプルのt検定を使用して、C1とC2があらかじめ設定した信頼度と異なるかどうかを確認できます。

+0

ケーブルと無関係な一貫性のある(変動性のない)差異がある場合はどうなりますか? – Benubird

+0

すべての賭けはオフです。モデルによって説明されていないものはすべて「残渣」とみなされます。モデルにはすべての体系的な変動要因、たとえ無視したいもの(「迷惑要因」と呼ばれています)を含めてモデルに組み込む必要があります。そうでなければ、あなたの意義を軽減します。 (しかし、その効果が小さい場合は、すべてを考慮に入れた超複雑なモデルよりも重要性の低い単純なモデルを選択することがあります)。 – AbsentmindedProfessor

0

私は正直なところ統計はあなたがここでやっていることに大きく貢献するとは思わない。データムを収集するコストは基本的にゼロです。あなたはそれを任意に収集できます。各ケーブルを通して数百万/億のパケットを消し、同じスケールで2つのヒストグラムにレイテンシをプロットします。違いが見えない場合は、おそらく意味のあるものではありません。

概要統計情報を破壊します。とにかくそれを使いたい理由はたくさんありますが、ここではそれらが役に立つとは思いません。もしあなたがを欲しいとしたら、私は確かに拍手喝采します。統計的な識字率は、誰かが彼らに馬鹿馬鹿したラインを与えているかを知りたいと思っている人にとって、基本的な技術だと思います。しかし、これらの2つのケーブルのレイテンシの違いを理解したいだけなら、うまくいったヒストグラムのペアは非常に有益です。

+0

Downvoter、実際にこの答えが間違っている理由についてコメントしてください。 –

+0

-1また、あなたはそれを無視して私の質問に "答えました"。役に立たない。加えて、あなたの答えは間違っています - ヒストグラムは、絵の表現として、必然的に数字よりも少ない情報を運びます。 – Benubird

+0

あなたの質問はほとんど無視されました。私はちょうど基本的な問題に乗ろうとしていました。これは、2本のケーブルの間に意味のある違いがあるかどうかという問題です。あなたはその質問に答えるために統計を必要とするかもしれませんし、それに対処するために必要な統計はt検定ではないかもしれません(標準t検定には等分散が必要です。あなたが実際にデータを見ているまで伝えてください。 –

関連する問題