2016-04-08 2 views
7

ネットワークをトレーニングする場合、N回の繰り返しごとに取られたスナップショットは、2つの形式で一緒になります。 1つは.solverstateファイルで、私はそれが鳴っているものと思われ、損失関数と勾配などの状態を保存していると思います。もう1つは、訓練されたパラメータを保存している.caffemodelファイルです。Caffeスナップショット:.solverstate vs .caffemodel

あらかじめ訓練されたモデルが必要な場合は、.caffemodelが必要なファイルなので、ネットワークをテストする場合にも必要なファイルだと思います。

WWhatは.solverstateに適していますか? this tutorialでは、トレーニングを再開できるようですが、それは.caffemodelを使用する方法とどのように違いますか? .solverstateには.caffemodelと同じ情報も含まれていますか?別の言い方をすれば、.caffemodelは.solverstateのサブセットですか?

答えて

4

solverstateファイルは、その名前が伝えるように、ソルバーの状態を格納し、分類結果に関連する情報は保存しません。モデルはカフェモデルファイルとして保存され、これを使用してデータの分類結果を取得できます。ネットワークを微調整したい場合は、事前に訓練されたカフェモデルファイルを使用することができます。これにより、ネットワークが最初から学習する必要がないため、時間が節約されます。しかし、停電や予期しない再起動のために現在のトレーニングを中止する必要がある場合は、ソルバステートの以前のスナップショットからトレーニングを再開することができます。 solverstateファイルとcaffemodelファイルを使用する場合の違いは、前者では事前に決められた方法でトレーニングを完了できますが、後者では最大反復回数などの特定のトレーニングパラメータを変更する必要があることです。