2017-10-23 4 views
0

私は機械学習コースを取っています練習2の第2部では、フィーチャマップを使用することになっています。そして、x1とx2のすべての多項式項にフィーチャを6番目のパワーまでマッピングすることで、新しいフィーチャを追加しました。しかし、インストラクターは私にこのアルゴリズムを使用すべきではないと言い、代わりにランダムにフィーチャーを追加するべきだと教えてくれました。しかし、我々はより良​​い分類するために新しい機能を追加しています。機能をランダムに追加することはこれをより複雑にしませんか?ランダムにフィーチャを追加するか、いくつかのルールに従わなければなりませんか?ランダムなフィーチャマッピング

答えて

3

既存のフィーチャの多項式などの新しいフィーチャを追加すると、複雑な仮説を使用してエラーを減らすのに役立ちます。しかし、これはトレーニングデータのオーバーフィットにつながり、テストセットで効率的な結果を生むことができません。

そうは、新しい機能を追加するために、次のように考慮されるべきである:

1)手動で結果を分析することによって、維持するために備えていますかを選択。

2)他の方法では、すべての機能を使用して、正則化を使用します。これにより、寄与する機能が少なくなり、ターゲット変数に寄与する機能がより重要になります。

3)ランダムに機能を選択することは、常に役立ちます。常に目標変数に寄与する機能を選択する必要があります。ランダムな選択は適切な解決策ではないかもしれません。

重要な注意

常にトレーニング中にエラーをチェックするために検証セットを使用しています。 多項式フィーチャを使用する際は、学習曲線をチェックして、モデルが列車データにオーバーフィットしないようにしてください。このような場合は、正規化パラメータ(λ)を増やしてみてください。正規化は、オーバーフィットを減らすのに役立ちます。

関連する問題