2017-11-21 4 views
-2

私は初心者です。私はGPAの予測をしています。私のデータセットには、学生の旅行時間、勉強時間、親の職業、成績、母親の職業などの変数があります。学生のGPAに影響を与える属性を取得できますか?私のデータには、カテゴリと離散の両方の値があります。どのように私は、Pythonのデータセットの結果に影響する属性を取得することができます

+0

これはあなたを助けるかもしれません。 https://machinelearningmastery.com/an-introduction-to-feature-selection/ – ANI

答えて

-1

私はあなたの質問から理解していることによると、どの機能が学生の最終的なGPAに影響を与えているのかを知りたいのですが、それは間違いありませんか?そうである場合、一部の機械学習アルゴリズムには、モデルに使用されている各フィーチャ(係数)の機能の重要性を示す組み込み関数が組み込まれています。たとえば、Logistic Regressionを使用している場合は、coef_というファンクションがあり、使用するフィーチャのすべての係数が得られます。 coef_についての詳細は、hereをご覧ください。この組み込み関数を持つ別のアルゴリズムは、ランダムフォレストです。このアルゴリズムには、サイズn_featuresの配列を生成するfeature_importance_という関数が含まれています。一般的に、フィーチャーの重要度(フィーチャーの重要度は高くなります)。 feature_importance_機能の詳細はhereです。

0

あなたの列車のデータにpythonでRandomForestRegressorを使用して、モデルに合わせることができます。次に、feature_importance_機能を使用して、各機能の重要性を確認することができます。また、モデルの説明力に興味がある場合は、treeinterpreterの関数treeinterpreterを使用することもできます。ツリーインタプリタの詳細を提供する2つのリンク(link1link2)があります。

関連する問題