私はまだRの方が新しいので、あまりにも基本的に思えば、事前に謝罪しています。次のように因子を含む複数の列にわたって最も頻繁に値を見つける方法
私の問題は、次のとおりです。
私は同じカテゴリを持っているいくつかの要因変数を含むデータセットを持っています。私は、カテゴリー変数を横切る各観測について最も頻繁に発生するカテゴリーを見つける必要があります。結びつきの場合は、任意の値を選択することができますが、私がそれ以上の制御権を持つことができれば幸いです。
私のデータセットには100以上の要素が含まれています。溶液は、各行の最も頻繁なカテゴリーを含ん例えばVAR5、のために、データフレーム内で可変であるべきである
id <- 1:3
var1 <- c("red","yellow","green")
var2 <- c("red","yellow","green")
var3 <- c("yellow","orange","green")
var4 <- c("orange","green","yellow")
df <- data.frame(cbind(id, var1, var2, var3, var4))
> df
id var1 var2 var3 var4
1 1 red red yellow orange
2 2 yellow yellow orange green
3 3 green green green yellow
:ただし、構造は、そのようなものです。
> df$var5
[1] "red" "yellow" "green"
どれでもアドバイスは次のようになります。それは、私はこのソリューションを持っていると思います。この場合
(データは数値ベクトルに最初に変換する必要がある場合には)因子または数値のベクターであり得ますとても有難い!前もって感謝します!以下のような
いい仕事、私よりもクリーナー。私はすべての変換、非公開などをスキップすることができなかったことを認識していませんでした –
このソリューションをありがとうございました。私は自分のデータで試したところ、完璧に動作します!どうか、私のために明確にしてください。どうすればこの方法で結びつきを解決できますか?ありがとう! – ZMacarozzi
ネクタイでケースを説明するために私の答えを編集しました。ヘルプページの使い方を学ぶのは良い習慣です。私のソリューションはあなたのために働いてうれしいです。 – Chargaff