2017-08-27 8 views
0

とLPPに私は最近、「Rに非常にnewie」これを行うための正しい方法についての質問を掲載しているあなたがそれに興味がある場合は、[こちら]それを見つけることができます。 1テストCSRはR

私は今、仕事をして、簡単なRスクリプトを開発するために管理しているが、今の結果は、私に困るものです。私はmad.test .That機能をlpp(リニアポイントパターン)を分析するためにRを使用してい

ロングストーリー短いは、帰無仮説は、点がランダムに分布していることである仮説検定を行います。現在、私は分析するために88 lppsを持っており、そのうちの86個はランダムに分布しており、2個はそうではありません。

これはランダムに分布していない2つのlppです。それらを見て enter image description here enter image description here

あなたが最初のもので、クラスタのいくつかの種類を見ることができますが、もう一つは3点のみを持ち、もう1つは3点のみが対応していないことを保証できる方法はありませんように私には思えますランダムな分布にする。 1つ、2つ、3つのポイントを持つ他のトラックがありますが、それらはすべて「ランダムな」lppsカテゴリに分類されるため、なぜこの1つが異なるのか分かりません。 CSRのテストのためにあまりにも少ないポイントでどのように多くのポイント:だからここ

が問題ですか?

私はまた、これらの2つのlppsが他よりもはるかに低いことに気付きました。 $statistic$rank品質分析指標のいくつかの種類であり、したがって、私は、「重要なもの」にグループに私のLPP分析をそれを使用することができます:私は、それは意味が、私は今無知RIGHだものを見つけることを試みてきたので、ここでは別のnewieの質問です「あまりにも小さなポイント」のものはありますか?

My Rスクリプトとすべてのshpファイルはhere(850 Kb)からダウンロードできます。

ありがとうございました。

+0

ありがとう私も同じ質問があります。どれくらいのものがあまりにも少ないですか。私はこれが文脈に依存していると理解していますが、文脈の中でさえ、時にはあまりにも小さな点があります。それで、ポイントパターン分析のために考慮すべき単位長さあたりのポイント数またはポイント数について。 – BKS

+0

申し訳ありませんが、私は同じ回答を探しているので質問に追加してください。今、すべての日イベントを1つのpppと毎日のlppにまとめると、合計ポイント数が違うことになります。あなたが1週間結合した場合、あなたは合計ポイントの数が異なります。私の場合、これらの組み合わせ(時間、日、週、月)を作成すると、私の場合、すべての組み合わせが有効で、それでも私の文脈ではありますが、私が使用する時間集計に基づいてランダムパターンまたはクラスタパターンを取得します。いくつかの集計はポイントがほとんどないので、ポイントパターンとしてそれらを勉強することがまだ有効かどうか疑問です。 – BKS

答えて

1

分析のために必要とされているどのように多くのポイントについての質問に普遍的な答えを与えることは不可能です。通常、スタンドアロン解析では0,1,2は少なすぎます。しかし、同じことを繰り返す測定の一部であれば、まだ興味深いかもしれません。また、私は、通常、3点のあなたの例は興味深いことを言うにはあまりにも少ないと言っています。しかし、極端な例として、1つの長い線分があり、一方の端が一方の端に近く、他方の端がもう一方の端で互いに接近している場合です。これはCSRにはあまり起こりそうもなく、その仮説を信じたくないかもしれません。これは、あなたの場合に起こったようです。あなたは予備成形されているモンテカルロテストにもう少しを読みたいかもしれませんランクに関するご質問については

。基本的には、ポイントパターンを1つの数字(線形Kの最大絶対偏差)で要約し、次にこの数字とCSRから無作為に生成された数字を比較します。あなたがCSRの99のシミュレーションを使用すると仮定すると、合計で100の数字があります。あなたのデータがこれらの中で最も極端なランク($statistic$rank==1)であれば、p値は1%です。 50番目の番号にランクされている場合、p値は50%です。別の数のシミュレーションを使用した場合、それに応じて計算する必要があります。私。 199シミュレーションではランク1は0.5%、ランク2は1%などです。

+0

ランクが何であるか説明してくれてありがとう@EgeRubak。私には、「品質指標」を得る方法がないと思われるので、分析を4点以上のトラックに限定します。 –

0

複数のテストには基本的な問題があります。あなたは仮説検定を88回適用しています。テストは(デフォルトで)アプリケーションの5%(1/20)で偽陽性を出すように設計されているため、帰無仮説が真であれば88回のテストで88/20 = 4.4の偽陽性が発生すると予想されます。したがって、2つの肯定的な結果(「非ランダム」)のみを得ることは、すべてのパターンがランダムであるという帰無仮説と完全に一致する。私の結論は、パターンはランダムであるということです。

関連する問題