2017-02-09 13 views
1

私はしばしばネットワーク統計の有意性テストのためのQAP(二次割り当て手順)テストを使用しますが、私は実際にサンプルサイズが実際に何かを理解したことはありません。ネットワークの数は?ノード?ネクタイ?サンプルサイズはQAPテストでどのように定義されていますか?

私は現在、2つのネットワーク間のgcor(Rパッケージのスタットネット内)の信頼区間を計算しようとしています。壁に当たったようです。私が読んだところでは、(効果的な)標本サイズが何であるかについて一般的な合意はありません。 誰が私にこれが何であるべきかアドバイスをくれますか?

私は2つのネットワークを持ち、それぞれ23のノードを持っています。各ネットワークごとに異なる数の結びつきがあります。 誰かがこれに関するアイディアを持っているなら、私はとても感謝しています!この質問があまりにも曖昧ではないことを願っていますが、一般的な問題は多くのネットワークテストに当てはまると思います。

答えて

0

グラフ相関の場合、サンプルサイズは、隣接行列の{i、j}セルの数であり、対角を除きます。言い換えれば、それはネットワークの総数または潜在的なつながりです。つまり、n *(n - 1)または[n *(n - 1)]/2(無向の場合)です。ここで、nはノードの数です。 gcorは、各ペアのタイの有無の相関を評価します。ここで、特定の場合に

> g1 <- rgraph(10) 
> g2 <- rgraph(10) 
> gcor(g1,g2) 
[1] -0.0784586 
> vg1 <- gvectorize(g1, censor.as.na = F) #This creates a vector of all non-diagonal pairs in the network, with 0 or 1 
> vg2 <- gvectorize(g2, censor.as.na = F) 
> cor(vg1,vg2) #Good old fashioned Pearson correlation 
[1] -0.0784586 

、23 *(23 -1)= 506または[23 *(23 -1)]/2 = 253

しかしながら、相関の信頼区間を構築あなたがQAPを使用しているなら、まったく別の問題です。 QAPはノンパラメトリック検定であるため、通常の信頼区間構築(通常は±1.96)で使用する臨界値は適切ではありません。

統計情報はネットワーク全体のプロパティであるため、特にグラフレベルの統計では、サンプルサイズは基本的に1です。 (またはネットワークを比較している場合は2)

関連する問題