2016-10-27 5 views
0

Tensorflowでテストセットにラベルを付けようとしています.Tensorflowを使用するには、セットを1回だけ繰り返し処理する必要があります。通常、私のバッチサイズの倍数になるようにいくつかの例をパディングしますが、この場合、何百ものファイルに分割されたデータを読み込むためにTensorflowのキューを使用しています。最後のバッチに到達すると、1つのバッチに十分な例がなく、プログラムが終了します。どうすれば解決できますか?テンソルフローで一度正確にデータを読み取る最良の方法は?

+0

テンソルフローのmnistの例を確認することをお勧めします。 input_data.pyのnext_batch()関数では、まずデータの順序をシャッフルし、次にバッチのデータを選択します。サンプルが終わったら、もう一度シャッフルして選んでください。 – Jin

答えて

0

tf.train.shuffle_batch()は列車と検証データセットの両方に使用していたので、tf.train.batch()を検証用に切り替えました。例の数はバッチサイズの正確な倍数ではないので、最後のバッチには既に処理されたいくつかの例があります。重複を破棄するために既にラベル付けした一連のサンプルIDを保持します。

関連する問題