Rプログラミングにとって非常に新しく、データのクリーンアップに取り組んでいます。私は、複数の列を持つデータを持つcsvファイルをアップロードしました。Rプログラミング:複数の列の値を置換する
データの特性は基本的にはyes/noですが、 '1'、 '2'、 '3'、 '4'とコード化されています。実際に '2'、 '3'、 '4'の値は意味がありません。値が0かどうかを示すだけです(値が0の場合は0、値の場合はno)
カラム
summary(data$P_FandB)
Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
1 1 1 1 1 1 54
summary(data$P_ITMobile)
Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
2 2 2 2 2 2 362
summary(data$P_Electronic)
Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
3 3 3 3 3 3 420
summary(data$P_Furniture)
Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
4 4 4 4 4 4 432
私は交換したいデータの要約、NA 1と0の値2、図3に示すように、データセット内のこれら選択列の4。 1、2、3、4をコードする他の列がありますが、それはデータセットに意味を持つコードです。
これは、R、3、4の値を1に置き換えるためのRプログラミングで行うことです。
data$P_FandB[which(data$P_FandB>1)]=1
data$P_ITMobile[which(data$P_ITMobile>1)]=1
data$P_Electronic[which(data$P_Electronic>1)]=1
data$P_Furniture[which(data$P_Furniture>1)]=1
私は1とNAに変換するための100の変数があります。
これらのデータを消去するにはどうすればいいですか?
ありがとうございました。
- lapply(データ[selcols]、機能(x)の置き換え(x、x> 1,1)) ' – akrun