私の犯罪分類データセットには、has_rifle
などのインジケータ機能があります。バイナリ分類とスパースバイナリマトリックス
仕事は、データポイントが犯罪者であるかどうかを訓練し予測することです。メトリックは加重平均絶対誤差であり、人が犯罪者であり、モデルが彼/彼女がそうでないと予測する場合、体重は5
と大きくなります。人が犯罪者でなく、モデルが彼/彼女がそうであると予測するならば、体重は1
です。それ以外の場合、モデルは正しく予測されます。重みは0
です。
私はメソッドをmlr
にR
で使用し、しきい値を1/6
に調整しました。結果はそれほど良いものではありません。 Adaboost
はやや良いです。いずれも完璧ではありません。
この種のバイナリ分類の問題で、どのような方法が一般的に使用されているのだろうか、曖昧な{0,1}
行列ですか?そして、加重平均絶対誤差メトリックによって測定された性能を改善する方法は?
私はそれはあなたがこのチートシートで見ることができるhttp://stats.stackexchange.com/questionsにその質問をする方が良いでしょうかhttp://datascience.stackexchange.com/users/13936 –
だと思います。http:/ /scikit-learn.org/stable/tutorial/machine_learning_map/index.htmlあなたがPythonでコーディングしていなくても。 – Till