CNNを3D画像(医療データ)に適用することに興味があります。 TensorFlowにはすでにこの機能が組み込まれていますか?畳み込みニューラルネットワークと3D画像
答えて
いいえ、現在の実装は2D画像(nn.conv2dのような関数)に対して行われます。複数のチャンネル(RGBなど)をサポートしており、3D画像をマルチチャンネルの2D画像(各Zスライスはチャンネル)として表現できますが、これは必ずしも理想的ではありません。さらに、これらのアプローチを使用する場合、医療分野では一般的には得られない相当量の画像データが必要です。
更新:TensorFlowとTheano(その後のKeras、Lasagneなど)は、すべて前述のように3D操作をサポートするようになりました。 3D操作は、同様の2D操作よりもはるかに計算量が多く、メモリ集約的であることに注意することが重要です。
3D画像でCNNを使用する場合は、このCaffe PRを使用することもできます。 データをHDF5形式に変換する必要があります。
TensorFlowは、マスターブランチで3D convolutionと3D poolingをサポートするようになりました。
5Dテンソルを入力として、形状:[batch_size, depth, height, width, channels]
で使用できます。
3Dトランスポーズ(デコンボリューション)はどうですか? –
あなたのおかげで、そのためのサポートが追加される途中に[pull request](https://github.com/tensorflow/tensorflow/pull/3049)があります。また、[この問題](https://github.com/tensorflow/tensorflow/issues/2467)も参照してください –
うわーは幸運でした –
3D畳み込みニューラルネットワークのためのTensorFlowの実装は、以下のオープンソースプロジェクトで提供されています
Lip Reading - Cross Audio-Visual Recognition using 3D Convolutional Neural Networks
Using 3D Convolutional Neural Networks for Speaker Verification
- 1. 可変サイズ画像を持つ2D畳み込みニューラルネットワーク
- 2. 畳み込みニューラルネットワークの列車画像の選択
- 3. 畳み込みニューラルネットワークの画像前処理
- 4. 畳み込み、画像上の画像
- 5. theano/lasagneとの畳み込みニューラルネットワーク
- 6. 畳み込みニューラルネットワーク - 可視化重み
- 7. 畳み込みニューラルネットワークのレイヤーを特定
- 8. 畳み込みニューラルネットワークのコスト関数
- 9. 実装畳み込みニューラルネットワークのケラス
- 10. 畳み込みニューラルネットワークの検証精度
- 11. 畳み込みニューラルネットワークの不均衡クラス
- 12. 畳み込みニューラルネットワークの層数
- 13. 畳み込みニューラルネットワークの認識タイプ
- 14. 畳み込みニューラルネットワークの次元
- 15. 畳み込みニューラルネットワークの入力データ
- 16. 畳み込みニューラルネットワーク - 複数のチャネル
- 17. Udacityディープラーニング畳み込みニューラルネットワーク - TensorFlow
- 18. 完全畳み込みネットワークトレーニング画像サイズ
- 19. トレーニング精度が画像分類のための畳み込みニューラルネットワークを実装
- 20. 非画像データに畳み込みニューラルネットワークを使用する方法
- 21. 空間畳み込み対周波数畳み込み画像の逆フィルタ
- 22. cs231n畳み込まれたニューラルネットワーク
- 23. 可変サイズ畳み込みニューラルネットワーク入力と固定出力
- 24. 畳み込みニューラルネットワークにおけるフィルタベクトルとそのレイヤ機能
- 25. Tensorflow畳み込みとnumpy畳み込みの違い
- 26. 畳み込みニューラルネットワークの精度を向上
- 27. 予測のためのTensorflowの畳み込みニューラルネットワーク
- 28. 畳み込みニューラルネットワークのフィルター係数を設定するには
- 29. データクラスタリングによるニューラルネットワークの畳み込みフィルタ設計
- 30. 畳み込みニューラルネットワークの近似能力はどうですか?
それはどのようにconv2Dから何が違うのですか? Conv3Dがバッチ+フィーチャーマップを作成するバッチ+イメージのように見えます。 conv2dの には、kxWxHフィーチャマップを作成するチャネルがある画像があります。 あなたはx枚の画像を持っていますか? x個の特徴マップが作成されます。 AM間違っていますか? – Breeze
まあ、conv2dは4次元の行列です(画像数、チャンネル数、x幅、y幅)。conv3d演算は5次元の行列です。 – kmader
ええ、それはそうです、私は操作が同じであればいいと思っています。操作がどのように行われているのか迷っています。時間的なストライドについて話すと、それはどういう意味ですか?私たちは時次元の進歩をどうやって行うのですか?私は5つのフレームを知っていて、一列に時間次元と呼ばれています。 (画像カウント、深さ、チャンネルカウント、x幅、y幅)を含み、ここでの深さは5である.5フレーム、例えば200x200x3とする。 この点でストライドはどのように意味がありますか? – Breeze