1
上位30パーセンタイル、中位40パーセンタイル、下位30パーセンタイルに従って、特定の変数(コードではwt_avgと呼ばれます)を分類しようとしています。例えばR数量エラー - 置換はn行、データはp
-
"x" はデータであり、 "クラス" は、私が欲しいの出力であるstructure(list(x = 1:10, class = c(1, 1, 1, 2, 2, 2, 2, 3, 3,
3)), .Names = c("x", "class"), row.names = c(NA, -10L), class = "data.frame")
。
これは私が使っていたコードである - $<-.data.frame
で
エラー(*tmp*
、 "状態"、値= cで(-13.38、-2.9725、 - 私は次のエラーを取得する
sent_data$wt_avg = with(sent_data, SENT_Orth_1 + SENT_Orth_2 + SENT_Orth_3)
sent_data$state = quantile(sent_data$wt_avg, probs = c(0, 0.3, 0.7, 1)
na.rm = TRUE)
を:交換は5行があり、データが603
私はこれをどのように修正することができます?ありがとう!
「quantile」の出力はわずかに異なります。最初のベクトルと異なる長さの出力を返します。すなわち、 'quantile(1:10、c(0,0.3,0.7,1))# 0%30%70%100% 1.0 3.7 7.3 10.0'新しい列の代わりに集計されたデータセットとして – akrun
ああ大丈夫です!私は 'if'条件を使用して、実際に分類するための "状態"変数を作成する必要がありますか?より速い方法がありますか?ありがとう! –
再現可能なサンプルと予想される出力を追加しないと残念です。私は今質問を編集しました。 –