2016-11-02 23 views
0

私は一晩ニューラルネットワークをトレーニングしていましたが、クラッシュしました。私は2つの質問があります:TFトレーニング中に破損したレコード

  1. このエラーの原因を教えてください。
  2. どうすればこの問題が再発するのを防ぐことができますか?

2主なエラーは、次のとおり

  1. ERROR:tensorflow:QueueRunnerの例外:52284962154
  2. DataLossError(トレースバックについては上記参照)での破損レコード:破損レコード52284962154

編集

同じコードが使用されました別のマシンでは、それは約6時間後に同じエラーでクラッシュしました。番号52284962154は同一でした。

+0

確かにバグのようです。 [githubに関する問題を開く](https://github.com/tensorflow/tensorflow/issues/new)できますか?バグレポートに含めることができる最小限の再現まで物事を煮沸することができれば、非常に役立ちますが、完全なトレースは関係なく役立ちます。 –

+0

もう一度やり直すと、同じ番号で同じエラーが発生します。 52284962154。問題を提出します。 – jkschin

+0

@AllenLavoie、このエラーは再現可能です。私たちは1300万の33x33x3パッチを持っていて、それを256のバッチで実行します。ステップ30747でバグが発生します。書き込み中に破損したTFRecordだと思われます。今何が最善のことですか? – jkschin

答えて

1

問題は書き込みエラーでした。データを再びTFRecordsに変換した後、エラーは消えました。今すぐステップ30747を超えることができます。

関連する問題