2017-05-19 9 views
0

人々は通常、変数とパラメータの初期値をどのように選択しますか?それがうまくいくまでちょっと試してみましょうか?テンソルフローのオプティマイザの変数とパラメータの初期値の選択

テンソルフローの入門チュートリアルに従っていて、線形モデルを訓練することができました。しかし、私は、変数W、bの開始値は地面の真理にかなり近いことに気付きました。

データを変更してグラウンドトゥルース値をもっと遠くにすると、グラジエントデリートオプティマイザはW、bのNaN値を返します。

しかし、一般的に、私はモデル内の変数の初期値を推測することは妥当ではないと思います。私は任意の出発点を選択して、私が欲しいところに行くことができるように思えます。

私のパラメータでの私の選択が悪いと思っていました。しかし、私はこれをどのように調整するかはわかりません。デフォルトは0.01で、私は0.001から100までの値を試しました。

一般的な機械学習ブックで、モデル変数の最適化パラメータの選択と初期値について議論しますか?本当に私はただの資源を探しています。

ありがとうございます!

答えて

0

畳み込みニューラルネットワークで有名な初期化子の一部:

Glorotノーマルは:またザビエルと呼ばれます。 stddev = sqrt(2 /(fan_in + fan_out))で0を中心とする正規分布。ここで、fan_inは重みテンソルの入力単位の数であり、fan_outは重みテンソルの出力単位の数です。

http://jmlr.org/proceedings/papers/v9/glorot10a/glorot10a.pdf

Lecun制服:限界がfan_in重量テンソルにおける入力ユニットの数であり、SQRT(3/fan_in)である[-limit、限界]内で均一分布。

http://yann.lecun.com/exdb/publis/pdf/lecun-98b.pdf

彼正常:fan_in重量テンソルにおける入力ユニットの数であるSTDDEV = SQRT(2/fan_in)で0を中心 切断正規分布。これらの初期化子とともに

http://arxiv.org/abs/1502.01852

、1レート、勢いやその他のハイパーパラメータを学習を検索する必要があります。

関連する問題