2017-06-03 11 views
0

は私が後押しディシジョン・ツリー回帰でチューンモデルハイパーモジュールで、次の構成を使用していたと同時に検証:チューンモデルハイパーモジュール:チューンとクロスが

enter image description here

この構成レットをいハイパーパラメータを調整して最高の決定係数を得ると同時に、最小の相互検証平均誤差を保証しますか? もしそうなら、チューニングモデルハイパーパラメータモジュールがこの設定を使って何をより詳細に知っていますか?

ありがとうございます。

答えて

0

train/testとしてデータセットを分割する必要はありませんが、モデルの精度を測定するためにクロス検証を使用します。 Tune model hyperparameterの入力として検証データセットは必要ありません。

ここでは、バイナリ分類の精度を測定するための簡単な構成を示します。 Partition & Sampleモジュールの特性が、ランダム分割で10倍交差検証のために調整されていることを確認してください。

評価結果は、最良のモデルを生成したパラメータと精度を示します。精度メトリックは相互検証パスから計算され、選択した折り返しの数によってわずかに異なる場合があります。

+0

「この折りたたみ割り当てが行われておらず、オプションのデータセットポートで検証データセットが提供されている場合、トレインテストモードが選択され、最初のデータセットがそれぞれのモデルをトレーニングするために使用されますモデルを評価データセットで評価します。ここで:https://github.com/Azure/azure-content-nlnl/blob/master/articles/machine-learning/machine-learning-algorithm-parameters-optimize.md しかし、トレーニング/テストデータの最初の分割スコアモデルとモデル評価モジュールを使用したい場合は、セットが必要ですか? – lucazav

+0

はい。スコアモデルと評価モデルが必要な場合は、スコアリングデータセットが必要です。その後、列車/テストの分割が必要です。次に、クロスバリデーションを使用して最良のモデルを選択したにもかかわらず、クロスバリデーションのスコアリングではなく、特定のモデルの評価/トレーニングのテストを行います。 –