各エポックのトレーニングサンプルをシャッフルして、各ミニバッチにデータセット全体の素敵なランダムサンプルが含まれるようにすることを私は理解しています。データセット全体をTFRecordsを含む1つのファイルに変換すると、データセット全体をロードするにはいかがですか?私の理解は、TFRecordファイルへの効率的なランダムアクセスがないことです。したがって、具体的には、このシナリオでTFRecordファイルがどのように使用されるかについてのガイダンスを探しています。TFRecordsとレコードのシャッフル
5
A
答えて
3
それはありません - 入力を複数の入力データファイルにシャーディングしてから、それを処理することができます。as explained in this answer。
"完璧な"シャッフルに近いものが必要な場合は、それをメモリに読み込む必要がありますが、実際にはほとんどの場合、100または1000ファイルに分割するだけで十分にシャッフルできます。 8〜16ファイル分のデータを保持するのに十分な大きさのシャッフルキューを使用します。
私は、ディスクにこぼれる可能性のあるランダムランダムシャッフルキューを作成するために頭の後ろにかゆみがありますが、それは私の優先順位リストでは非常に低いです - 誰かが貢献したい場合は、それ。 :)
+6
どのようにそれはかゆみですか? +1 – TimZaman
0
実際には、TFRecordsに保存する前にシャッフルについて心配する必要はありません。 TFRecordsを読むには(現在)推奨されている方法はtf.data.TFRecordDataset
で、.shuffle()
メソッドを実装しているからです。
関連する問題
- 1. ページ更新時のMySQLレコードのシャッフル
- 2. Tensorflowの.tfrecordsファイルからのレコードの総数の取得
- 3. シャッフルとMapReduceの
- 4. TFRecords QueueRunnerエラー
- 5. イメージのシャッフルとスライス
- 6. スパークreduceByKeyとシャッフル
- 7. TFRecordsファイルの前処理テキストデータ
- 8. スパークのシャッフル・リードとシャッフル・ライトの違いは何ですか?
- 9. カードのデッキとシャッフル方法
- 10. 分類用の画像とマルチラベル付きのtfrecordsの作成
- 11. Pythonのシャッフル
- 12. angularJSのシャッフルdiv
- 13. 色のシャッフル
- 14. カードのシャッフルC#
- 15. スパークのシャッフル
- 16. TFRecords:テンソルのリストをシングルに書く例
- 17. Estimator APIとTFRecordsデータセットを使用したTensorflowでのデータ拡張
- 18. tfrecordsからデータを読むときの形について
- 19. アンドロイドのラジオボタンのシャッフル
- 20. TensorFlowの特定のレコードを.tfrecordsファイルから選択するにはどうすればよいですか?
- 21. ボタンテキストと背景のシャッフル表示
- 22. パッカーjsシャッフルとコンテナへのフィット
- 23. Fisher-Yatesシャッフルとリザーバサンプリングの違い
- 24. 複数のデータフレームをまとめてシャッフル
- 25. シャッフル配列のキーと値php
- 26. リスト内のシャッフル値
- 27. Scalaのリストをシャッフル
- 28. PHPのシャッフル機能
- 29. Unityのシャッフル配列
- 30. の生成前シャッフル
'RandomShuffleQueue'を使う' shuffle_batch'があります。それはデータセットのバッファされた部分をシャッフルします。この質問には詳細があります - http://stackoverflow.com/questions/33715728/using-queues-to-uniformly-sample-from-multiple-input-files –
これは参考になります彼が提案するソリューションはまだデータセット全体をロードします。クラスがミニバッチで等しく表現されることを確認する問題があるようです。データセット全体をロードすることが現実的でない場合は、ファイル名のキューを維持し、個々のインスタンスをロードすることが最良の方法であると思われます。このシナリオでは、TFRecordは大きな価値を提供していないようです。 – bobw