0
私は教師の評価を持つデータセットを扱っています。一部の生徒は同じ教師を2回以上評価しました。二回だけ1等級を維持重複したIDSからランダムな行を選択
1)任意のユニークな学生のIdsを維持し、生徒が教師を評価ケースで評価
2):私は、データをどうしたい何 は、以下の基準でそれをサブセットすることですランダムに保持するレーティングを選択することができます。
3)可能であれば、すべての解析ファイルの先頭にあるスクリプトでコードを実行し、作成されたデータセットが解析ごとに同じであることを確認します(シードを設定しますか?)。
# data
student.id <- c(1,1,2,3,3,4,5,6,7,7,7,8,9)
teacher.id <- c(1,1,1,1,1,2,2,2,2,2,2,2,2)
rating <- c(100,99,89,100,99,87,24,52,100,99,89,79,12)
df <- data.frame(student.id,teacher.id,rating)
今後の進め方についてのお問い合わせありがとうございます。
複数の教師に評価された場合の変化は?私は自分のデータを更新することができます。 – bfoste01
スプリットは、教師と学生IDとのやり取りを行う変数上になければなりません。私の更新された答えを見てください。 – lmo
すばらしい。それはたくさんの助けになります!コードを高速化する方法はありますか?私は100,000 IDSを持っているので、最終的なdo.callの解決策に収束するのはかなり遅いか、それとも速いですか? – bfoste01