こんにちは私はRスタジオを使用して、データセット内で5000回も表示されないワインの種類を除外しています。setDを使用して値を削除するRのサブセット
私は、以下の機能を実行している - 私は、私はまだ他の632個の値を取得するがありますどのように多くのレベルを参照しようとすると、しかし
#create new data frame with varities greater than 5000
wineVar <- setDT(wineNew)[, if(.N > 5000) .SD, by = variety]
#list the unique varieties to show theres only 5
unique(wineVar$variety)
を。
[1] Cabernet Sauvignon Pinot Noir Chardonnay
[4] Bordeaux-style Red Blend Red Blend
632 Levels: Žilavka Agiorgitiko Aglianico Aidani Airen Albana AlbarÃn ... Zweigelt
それは私のトレーニングセットの問題を引き起こしていると完全にこれらを削除する方法があります - まだ訓練セットに値を見ているが、ドロップされた品種のデータはありませんとIEが。
リファクタリングするだけです。 'wineVar $ variety < - factor(wineVar $ variety) 'のように – Eric