「男性」と「女性」のような同じ情報を含むデータセットに2つの変数があるとします。 2つの列に同じ情報が含まれていることをテストすることで、そのうちの1つを削除できますか?R:変数に同じ情報が含まれているかどうかをテストする
私はそれらを含む行列のランクを調べることを考えましたが、明らかにそのような行列は完全にランク付けされていますが、列は明らかに互いに依存しています。
EDIT:
M F
1 0
1 0
0 1
0 1
1 0
が明らかに同一の情報が、これらの二つの変数内に含まれている:私は、次のような2つの変数を意味します。それをどうやってテストするのですか?
こんにちはノア、あなたは何を意味するの例を挙げることができますか?列が同一(同じ値、同じ順序)であること、または同じ要素レベルを持つことだけを意味しますか? –
行列の階数を使用する場合は、1の列を追加する必要があります。これを追加すると、3つの列があっても、結果の行列のランクは3ではなく2になります。 – Dason
提示された例では、それらは1または-1の相関関係を持ちますので、 'apply(cor(df)、1、function(x){any(abs(x)== 1) }) 'がありますが、倍数がある場合は、それらがどのようにペアになっているかを調べるために' cor(df) 'を調べなければなりません。 – alistaire