2016-12-20 10 views
2
のみ

the error messageなぜデータが大きすぎるのCNNモデル?

the model structure

  • 使用kerasとtensorflowバックエンド
  • 使用のCPU、メモリ128ギガバイト
  • 入力データ形状(45,1024,1024)
  • を有するモデルのみ有します1つの畳み込み、1つ(2,2)最大プール
  • 1024 * 1024完全接続。

私は、このエラーメッセージました:

無効な引数を:

4194304 = 2048 * 2048 
1048576 = 1024 * 1024 
:形状は、[4194304,1048576]その(以上 1099511627776エントリ)

ノート大きすぎます

ケラスはどのようにこの形状を計算しましたか?なぜそれは大きすぎるのですか?次のように

答えて

0

形状[4194304, 1048576]が計算されます。サイズ[1024, 1024, 3]の入力にsame国境モードでサイズ[3, 3]の16の畳み込みを適用

は私たちにサイズ[1024, 1024, 16]の出力を提供します。サイズ2の最大プールの後には、[512, 512, 16]になり、平坦化されたときには512 * 512 * 16 = 4194304となります。 1048576は、Denseレイヤーコンストラクターで指定したとおり、1024 * 1024から来ます。

私はあなたのモデルのアーキテクチャを再考すべきだと思います。小さなサイズの入力を使用したり、いくつかのプール層を追加したり、1 x 1畳み込みを適用して次元数を減らすことができます。そして、私は、完全に接続されたレイヤーでは1024 * 1024が妥当な数のノードであるとは思っていません。

関連する問題