機械学習タスクを試みている。したがって、私は私のデータを変換する必要があります。 (全く不十分な番号が存在しない):例えばY変数を因子に変更し、情報を失う。
df$target
9.0
8.0
6.0
6.5
しかし数字はお互いに閉じるようにした:
ターゲット変数は数値です。クラス=数値
> df$target <- cut(df$target, 4)
> levels(df$target) <- c("Bad", "Neutral", "Good", "Amazing")
ので、私はそれらの要因(それはMLのために必要とされる)製:したがって、私は、内の数字を変更し
のdf $ターゲット< - as.factor(DFの$ターゲット)
しかし、私はラベルをチェックすると、私が作ったとして、彼らはレベルで応答していないことを見るのは興味深いですが、と:
>unique(df$target)
>[1] 42613 42475 42399 42536 42735 42521
私は4つのユニークなラベルである必要があります:不良、ニュートラル、良いと驚くべき。それはどのように機能していない可能性がありますか?さらに優れています。この問題をどうやって解決できますか?
に問題は私が< 'DF $ターゲット1あなたの方法を試した - カット(DFの$ターゲット、 df $ target1# [1] Amazing Good Bad Bad レベル:悪いニュートラル良い非常に素晴らしい(4) レベル(df $ target1)< - c( "悪い"、 "ニュートラル"、 "良い" 'それは'数値 'に変更されていません。別のことをしましたか – akrun
私が追加したのは、colnames(df)< - c( "...."、 "target") –
'cut'が' factor'を出力するので、 'df $ target < - as.factor(df $ target) 'です。あなたがやっていることが他にない限り。 –