私は200万行のdata.frameを持っています。カラムの1つは英数字のIdで、そのカラムで一意のカウントが300000と繰り返されますか?私はその因子変数を印刷しようとするとRの因子レベルが数値で表示されない
>head(df$ID)
ID
AB00153232de
AB00153232de
AB00153232de
AB00155532gh
AB00155532gh
AB00158932ij
>df$ID<-factor(df$ID)
私はこのような何かを得る:
>df$ID
[1] AB00153232de AB00153232de AB00153232de AB00155532gh AB00155532gh AB00158932ij
320668 Levels: AB00153232de AB00155532gh AB00158932ij.....
は数値ベクトルと理由として格納されていない要因となっていますか
が、私はベクトルまたは配列のインデックスとして、これらのレベルを使用できますか? – TUSHAr
'unclass'を実行した後にレベルだけが必要な場合は、これを試してください:' attributes(unclass(df1 $ ID))$ levels' – Sathish
2次元配列を作成する2つの因子変数を持つdata.frameがあります。 (マトリックス)。私の質問は、行列要素M ["factor1"、 "factor2"]にアクセスしようとすると、Rが内部的に数値レベルでそれを検索するのでしょうか、それとも文字値を使って検索しますか? 2番目のケースでは、最適化ステップとして数値を検索するためのロジックを追加する必要があります。 – TUSHAr