私の最初の予測モデルを作成し、その結果は絶対にひどいです。 このトラブルシューティングの方法を特定するための助けが必要です。初心者のモデルの悪いトラブルシューティングのガイド
リニア回帰を行っています&ロジスティック回帰分類は、生徒がコースを通過するかどうかを予測するために、1つははい、0は0になります。
データセットは1つのクラスに対して完全なデータしか持たないので、わずか60個の行の下に16個のフィーチャがあり、35個が成功し、25個が失敗したためです。 私のデータセットが単に小さすぎるのかどうか疑問に思っています。
まだデータセットを共有したくはありませんが、完全に匿名のようにそれをクリーンアップします。
ROCは非常に非常にギザギザであり(ログ回帰のために)、何よりも多くの誤検出を予測します。
私がプロに就職する前に試してみることのできる初心者のための一般的なトラブルシューティングのアドバイスをお寄せいただきありがとうございます。
ありがとうございました。
ありがとうございます。私はフィーチャー・ジェネレーションに数日を費やして、データから何かを作ることができるかどうかを確認します。正確な予測を行うためにデータ間の関係が不十分で、データを拷問して、できないことをするよりも、特定の機能やデータのセットを終了することをお勧めします。 ? –
あまりにも相関がないデータセット、あまりにも小さなデータセット、それはwhayの探査、フィーチャエンジニアリング、その前処理、重要なフィルタベースのフィーチャの選択、それはあなたを助けてくれるでしょう事前トレーニングの仕事は、おそらくデータセットはそれほど強力ではありませんが、いくつかのクリーニングの後、いくつかの計算された機能を追加し、他のものを削除すると、それは別の話になります –