Rでは、文字データ型を含む列の最小値を調べようとしています。列の値の大部分は実際には数値ですが、一部の値は文字列 "Not Available"です。"Not Available"の文字列値を含む列を並べ替えるR
私はこれを使って値を取得していました。
minRate <- min(myRows[,columnIndex], na.rm = TRUE)
これは、私のテストのほとんどでうまくいくようです。しかし、値は文字列であるため、「10.6」はアルファベット順に「8.6」の前に来るため、「10.3」などの値は「8.6」などの値よりも低くソートされます。次のように
だから、私はミックスに「as.numeric」を追加しました:
minRate <- min(as.numeric(myRows[,columnIndex]), na.rm = TRUE)
しかし、今私は「強制によって導入のNA」、と言って警告が表示されます。また、実際の(不正確な)数値ではなく、答えとして "NA"が返されます。
「利用できない」値を削除しても、この列から実際の最小値を取得する方法はありますか?
データの読み取り中に 'read.csv/read.table'で' na.strings = "Not Available"を使用し、変換する必要はありません数値に変換する。あなたが言及した問題に関しては、列が 'factor'クラスである可能性があります。したがって、数値型に変換すると整数型に変換されます – akrun
@akrun - これを答えとして追加してください。それは助けになった。 – WEFX
ありがとう、私は解答としてコメントを投稿した – akrun