で作成するこれは多少の質問ではありませんが、私はフォーラム を見て、私がしようとしていることを検索する方法を見つけることができませんでした。 私はトレーニングセットを持っており、カテゴリ変数のレベル数を減らす方法を見つけようとしています (下の例ではカテゴリが状態です)。私は州をレベルの平均または率にマップしたいと思っています。 私のトレーニングセットは、データフレームに入力した後、次のようになります。変数を基にした集計列をR
state class mean
1 CA 1 0
2 AZ 1 0
3 NY 0 0
4 CA 0 0
5 NY 0 0
6 AZ 0 0
7 AZ 1 0
8 AZ 0 0
9 CA 0 0
10 VA 1 0
私はクラス変数に基づいて、第1のカラム(状態)の平均値であることを私のデータフレームにおける3番目の列をしたいと思います。 CA行の平均値は0.333 ... になりますので、平均列を状態列の代わりに使用することができます Rに明示的なループを記述することなくこれを行う良い方法がありますか?
トレーニングセットに含まれていない場合は、新しいレベル(新しい状態の例)をマッピングするにはどうすればよいですか? Rでのアプローチへのリンクは、非常に高く評価されます。
私は外部のパッケージを使用する必要がないので、私はこの答えを受け入れました。あなたは答えを逆にして授業をしてもらえますか?例:with(dfrm、ave(class、state)) – ak3nat0n