これは私のデータの小さなサンプルである:一番上の行は、異なる樹種(例えば、PJ =ジャックパイン)を示すコードを含むRデータフレームの値に基づいてフィルタリング
。数値は、調査プロット内の各種のカウントを表します。それぞれの事例は、森林管理者(B)によって一度評価され、規制当局(A)によるプロットベースの調査で監査されたスタンドを表す。私は2つのサンプルが同じ母集団から取られた確率を決定するためにRのchisq.testを使用したいが、ソースAの結果とソースBの結果を本質的に比較する。それぞれの場合について、0の値をNA AとBの両方のソースには0があります。それ以外の場合は、テストの自由度を不必要に膨らませてしまいます。私はRに非常に新しいです。
多くのケースでカイ2乗検定を行いたい、そしてデータセット全体に15種までが含まれています。ほとんどの場合、対処すべき2〜7種がある。あなたの助け
これらの操作の2つの方法: '?reshape'を使用してワイドデータセットに変換し、' PJ.A'と 'PJ.B'を比較してください。あるいは 'source == 'A'と 'B'に' subset'をそれぞれ使用して、論理:PJ0aとPJ0bを作成し、マージキー 'case'の元のデータセットに2対1マージします。 – AdamO
あなたのデータの絵を使うのではなく、 'dput()'や 'dput(head())'を使ってください。 – Aramis7d
ok、私は将来それをやろうとします –