2017-04-05 14 views
0

私は上の学生とGPAS、例えばif文を使ってデータを分割する方法は?

Student  GPA 
Jim   3.00 
Tom   3.29 
Ana   3.99 

とを含み、Rでのデータセットを持っています。

ビンに入れる列が必要です。たとえば、

Student  GPASplit 
Jim   3.0-3.5 
Tom   3.0-3.5 
Ana   3.5-4.0 

GPAの統計情報を取得しようとすると、すべてのビンが実際のGPAに基づいて区切られます。たとえば、3.5人以上の学生がいくついるか、GPAは3.0〜3.5人なのかなどの割合を調べようとしています。しかし、私は実際のGPAの点でパーセンテージを取得しています.400データポイントすべてが異なるGPAを持っていると、GPAが3.5より高いものがいくつあるのか把握するのは難しいですか?これは理にかなっていますか?ごめんなさい。

+3

あなたは 'cut' –

+0

http://stackoverflow.com/questions/23664942/r-split-data-into-categoriesを使用してみました – jogo

答えて

5

cut()関数を使用して、定義したビンにデータを分割できます。あなたは境界線に正確に当てはまる値を注意しなければなりません。そして、あなたが望むように扱われていることを確認してください。あなたの例のデータでは:?

> df$GPA_split = cut(df$GPA, breaks = c(3.0, 3.5, 4.0), include.lowest = TRUE) 
> df 
    Student GPA GPA_split 
1  Jim 3.00 [3,3.5] 
2  Tom 3.29 [3,3.5] 
3  Ana 3.99 (3.5,4] 
# Count values in each bin 
> table(df$GPA_split) 

[3,3.5] (3.5,4] 
     2  1 
関連する問題