データフレームにフラグが「0」と「1」の列が多数あります。私はデータフレームをインポートするときにクラス "整数"に属します。Xgboost - 0と1だけの場合は、係数を係数に変換する必要がありますか?
は0を示し、1はすべての列に存在することを示す。
私はfatorsに変換する必要がありますか?[現在彼らは整数とはいえ0 & 1ほとんど似ていながらの要因はレベル1 & 2を行います]
私は後で予測モデルを構築するためにxgboost使用する予定。 Xgboostは数値列でしか使えないので、列をfactorに変換すると、それらを数値に変換するためにワンホットエンコードする必要があります。
(サイド質問:私たちは共線を削除するには1つのホットエンコーディングをすれば、我々は常に1列を削除する必要がありますか?)
ないこれを求める権利フォーラムを使用するには。 [Cross Validated](http://stats.stackexchange.com)を試してみてください。 –
私にお知らせいただきありがとうございます。 – Aman
私は@ KarthikArumughamとは違うことを頼みますこれはSOの範囲に入るプログラミング問題です。 – abhiieor