私は、Kerasの何百万という小さな画像(~~ 100x100px、それぞれ3チャンネル)で非常に大きな神経回路網(fc、conv、poolなど)を学習する準備をしています。すべてのファイルは約〜800 GBになり、私の質問があります。どのようにデータを処理するのですか?大きな神経ネットワークのデータバッチを管理するにはどうすればいいですか?
私はKerasがバッチを処理することは知っていますが、それぞれ8GBの100ファイルを持つネットワークを学ぶ方が良いでしょうか?〜300kファイルを作成した方が良いでしょうか?私はそれがより大きいファイルを持っていることが良いと思うし、300k回よりも8倍(8つの大きなファイル)を読むのが速いですが、わかりません。
私は100 GB未満のRAMしか持っていないので、一度に全データを読み込むことはできません。
ありがとうございます!