R(Framingham Heart Studyのデータ)にデータセットがあり、BMIグループを " 「正常」、「太り過ぎ」、および「肥満」を含む。Rでグループを割り当てようとしましたが、NAの値を入力してグループに属する他のグループが見つかりません
これは11,000以上の観測値と38個の変数/列を持ちますので、ここにデータの一部を投稿するのは難しいでしょう(これがなければ、それほど大きな問題にならないといいですね)。
データセットがFRMと呼ばれ、私は次のようにサブセットしようとしています:「」
frm$BMIGRP <- NA #Creating new variable (this part works and creates a BMIGRP column with all NA values)
frm$BMIGRP[which(as.numeric(frm$BMI) < 18.5)] <- "underweight"
しかし、私が持っている、と示されたデータセットBMI変数(中NA値がありますまた、NAに変更しようとしました)。
私は各グループに対してこの方法をサブセット化しようとすると、いくつかのアンダーウェイト値を「アンダーウェイト」に割り当てており、多くのNA/"。値を過小評価することもできます。それから私は、データセットを見ることができるので、ちょうど真実ではない肥満のカテゴリーに10の "正常な"体重の被験者と約11000があることを私に伝えます。
これが正しく行われると、各カテゴリに数百から数千の観測値を持つ4つのグループが作成されます。しかし、私は唯一の正常10、肥満体重71、および肥満〜11,000を得ています。
私はこの問題にどこが間違っているのか分かりません。また、新しい変数を作成して同じ種類の方法で割り当てることもできます。どんな助力も非常に感謝しています。
私は教授がラボセッションの一例として私たちに与えたコードであり、基本的には私のデータセットの適切な置き換えでそれをコピーして貼り付けています。
これは私のウェブサイトの最初の質問ですので、不完全な場合、または詳細情報を提供する必要がある場合はお詫び申し上げます。ありがとう!
BMI列class(frm $ BMI)のクラスを確認してください。数値でなければなりません。 – leeum
それは数字ではありませんでした。何らかの理由でcharでした。ありがとう! –