fit
メソッドで訓練された分類子の訓練に使用される特徴名のリストを取得する方法はありますか?目に見えないデータに適用する前にこの情報を入手したいと思います。 トレーニングに使用されるデータはパンダDataFrame
です。私のケースでは、分類器はRandomForestClassifier
です。分類器から訓練特徴名のリストを取得
0
A
答えて
1
ドキュメントと以前の経験に基づいて、分割の少なくとも1つで考えられる機能のリストを取得する方法はありません。
予測にすべての機能を使用したくないという懸念はありますか?トレーニングに実際に使用されたものだけですか?この場合、私はfeature_importances_
をフィッティングしてリストアップすることを提案し、関係のないように思われない機能を除去します。次に、関連するフィーチャだけで新しいモデルを訓練し、それらのフィーチャを予測にも使用します。
1
トレーニング用に選択された機能を知る必要はありません。予測ステップの間に、適合する分類器にと同じ機能を与えてください。学習フェーズの間に使用してください。
ランダムフォレストクラシファイアは、分割を行う機能のみを使用します。それらは第1段階で学んだものと同じです。他は考慮されません。
あなたテストデータの形状はトレーニングデータと同じでない場合それは、テストデータが使用する決定木の分割のために使用されるすべての機能が含まれている場合でも、エラーがスローされます。
ランダムフォレストは、すべての機能が少なくとも一度使用される可能性が高い(sklearn
でestimators
と呼ばれる)あなたの意思決定ツリーのための機能のランダムな選択をするために、より多くの何。
しかしあなたが使用する機能を知りたい場合、あなたは一度だけを装着し、あなたの分級の属性n_features_
とfeature_importances_
を呼び出すことができます。
hereを見ると、使用した最も重要な機能の名前を取得する方法がわかります。
関連する問題
- 1. バイナリ分類のためのマルチクラス分類器の訓練
- 2. 著者名を認識するためのNER分類器の訓練
- 3. 各クラスの最近傍分類器訓練サンプルサイズ
- 4. Tensorflow線形分類器が訓練していない
- 5. Tensorflow:MNISTデータセットの線形分類器の訓練された重みの可視化
- 6. SVM分類器を訓練している間に行動が変化する
- 7. 訓練されたスタンフォード分類器をJavaで保存してロード
- 8. 自然言語分類器は訓練されていない項目の分類を返します
- 9. 訓練された分類器を、訓練された他のクラスのうちの1組のクラスからのみ予測する
- 10. 複数のSVM分類器(または「任意のML分類器」をscikit-learnを使用して組み合わせる方法「決定特徴分類器」
- 11. 類似画像訓練セットジェネレータ
- 12. ARKitから特徴点を取得
- 13. 肯定的な文章のみを使った分類訓練
- 14. 画像テンソルフローの特徴を抽出するための事前訓練モデル?
- 15. クラシファイアが訓練された後、wekaでテキストを分類する
- 16. 画像にOpenCV SVM分類子を訓練する方法
- 17. スタンフォード分類器対ウェカ分類器
- 18. SegNet - 自分のデータセットを訓練
- 19. beautifulsoup未分類リストからhrefを取得
- 20. HOG特徴類似測定?
- 21. ナイーブベイズ分類器
- 22. 特異性を訓練する
- 23. nltk naivebayesテキスト分類用の分類器
- 24. OpenCvを使用した画像特徴分類のSVM
- 25. kerasライブラリを使用してNLP分類を訓練する方法は?
- 26. 各文書の訓練されたDoc2Vecモデルからnumpyベクトルを取得する
- 27. Kerraで事前に訓練されたAlexNet分類を変更する
- 28. 睫毛/鼻の特徴dlibとopencvだけを検出するための列車分類器?
- 29. テンソルフロー分散訓練とエスティメーター+実験フレームワーク
- 30. 特徴の出現順に基づく分類
解決策は、機能の数だけで、名前は返しません。私は予測段階で、名前を提供する必要はなく、同じ機能を提供する必要があることを知っています。しかし、私の場合は、トレーニングのために選択された機能(そしてこれが重要であれば列の順序)は何かを事前に知ることはできません。 – user6903745
@ user6903745:トレーニング用に選択された機能を知りたいのはなぜですか? – MMF
私は、引数として分類子をとる関数を作成しています。先験的なことが分からないかもしれない変数のリストをハードコードしたり、タイプミスを避けたり、変数の無限リストを入力するだけでは、それを分類器自体に格納しておくとよいでしょう。 – user6903745