私はTensorFlowモデルを微調整のセッションで約1週間トレーニングしています。TensorFlow:NotFoundError:チェックポイントにキーが見つかりません
...
conv_decode4/ort_weights/Momentum (DT_FLOAT) [7,7,64,64]
loss/cross_entropy/avg (DT_FLOAT) []
loss/total_loss/avg (DT_FLOAT) []
up1/up_filter (DT_FLOAT) [2,2,64,64]
...
方法:私は、チェックポイントファイルは、今では2つの空の層を有していることがわかりinspect_checkpoint.py使用
tensorflow.python.framework.errors_impl.NotFoundError: Key conv_classifier/loss/total_loss/avg not found in checkpoint
[[Node: save/RestoreV2_37 = RestoreV2[dtypes=[DT_FLOAT], _device="/job:localhost/replica:0/task:0/cpu:0"](_arg_save/Const_0_0, save/RestoreV2_37/tensor_names, save/RestoreV2_37/shape_and_slices)]]
:私はモデルを微調整しようとしたとき
今日、私はエラーを得ましたこの問題を解決しますか?
SOLUTION:
明確にするために編集以下mrryの提案に続いて:あなたのチェックポイントは壊れあるよう幸い
code_to_checkpoint_variable_map = {var.op.name: var for var in tf.global_variables()}
for code_variable_name, checkpoint_variable_name in {
"inference/conv_classifier/weight_loss/avg" : "loss/weight_loss/avg",
"inference/conv_classifier/loss/total_loss/avg" : "loss/total_loss/avg",
"inference/conv_classifier/loss/cross_entropy/avg": "loss/cross_entropy/avg",
}.items():
code_to_checkpoint_variable_map[checkpoint_variable_name] = code_to_checkpoint_variable_map[code_variable_name]
del code_to_checkpoint_variable_map[code_variable_name]
saver = tf.train.Saver(code_to_checkpoint_variable_map)
saver.restore(sess, tf.train.latest_checkpoint('./logs'))
チェックポイントファイルのキー「loss/weight_loss/avg」はありますか?最初の例外メッセージは、それがそうでないことを示唆しています。 (私はあなたが作った他の変更は理解していませんが、完全なコードブロックは分かりやすいように見えます) – mrry