私は13の変数と100000の観測値を含むデータセットを持っています。因子数の希少値の再組み込みR
item_color
と呼ばれる1つの列は、アイテムの色を示し、85レベルです。希少な色を再結合したいので、レベル数を減らすことができます。私の閾値は200です。したがって、データセットの色が200未満の場合は、「他の」カラーグループに入れたいと思います。
私は知っている、彼らの番号を見つけるためにlength
を使用することができます。しかし、私はコードを作成するための正しいロジックを見つけることができません。私はこれを書いた:
order$item_color <-
ifelse(length(order$item_color[order$item_color]) < 200, "Other", order$item_color)
しかし、それは "他の"とすべての色を置き換えました。
おそらく 'table'を使う方が簡単でしょう。もっと具体的な解決策が必要な場合は、再現可能なおもちゃの例を入力してください。 – lmo