2017-02-02 14 views
2

私はバージョン2 Beta 9.0のMicrosftのPython CNTKチュートリアルを行っています。私は、利用可能なさまざまな学習者に渡すために推奨される値の例を持つ良い文書を見つけられませんでした。私はCNTK 103に取り組んで以下の学習者を取得することができました:パートBを - MNIST toturialとフォワードネットワークフィード:CNTKの学習者向けの例

lr_per_minibatch=learning_rate_schedule(0.2, UnitType.minibatch) 
    trainer = Trainer(z, ce, pe, sgd(z.parameters, lr=lr_per_minibatch)) 

    lr_per_minibatch=learning_rate_schedule(0.2, UnitType.minibatch) 
    trainer = Trainer(z, ce, pe, adagrad(z.parameters, lr=lr_per_minibatch)) 

    lr_per_minibatch=learning_rate_schedule(0.05, UnitType.minibatch) 
    trainer = Trainer(z, ce, pe, adam_sgd(z.parameters, lr=lr_per_minibatch, momentum=momentum_as_time_constant_schedule(700))) 

    lr_per_minibatch=learning_rate_schedule(0.2, UnitType.minibatch) 
    trainer = Trainer(z, ce, pe, nesterov(z.parameters, lr=lr_per_minibatch, momentum=momentum_as_time_constant_schedule(700))) 

    lr_per_minibatch=learning_rate_schedule(0.1, UnitType.minibatch) 
    trainer = Trainer(z, ce, pe, rmsprop(z.parameters, lr=lr_per_minibatch, gamma=0.90, inc=0.03, dec=0.03, max=0.1, min=0.1)) 

これらの作品が、誰もがそのパラメータの推奨値の良い例を持っていません各トレーナーは受け取りますか?

答えて

1

現在の学習者にとって、最良のパラメータは、データと解決している問題によって異なります。したがって、良い勧告を提供することは非常に困難です。 1つの典型的なアドバイスは、学習率がうまくいく場合には、より小さな学習率でも効果がありますが、もっと長く実行する必要があります。

+0

adam_sgdオプティマイザの使用中に、学習率と勢いについて具体的な推奨事項はありますか? –

+0

いいえ、私はチューニングパラメータを持たないトレーナーに取り組んでいます。 –

+0

これは素晴らしいですね。私は何か他のことをお勧めします。私はCFD有限要素解析に携わっています。初めに収束したモデルまたはソルバーを使用して計算を開始すると便利な場合もありました。その後、シミュレーションの途中で、シミュレーションの後の段階でより正確で正確な別のものに変更します。 –

関連する問題