私は、Guptaなどの論文「自然画像のテキストローカライゼーションのための合成データ」を実装し始めました。私は重大な問題に遭遇しました。TensorFlowの完全畳み込みネットワークで損失を実装する方法は?
ネットワークアーキテクチャは完全畳み込みネットワークです。最終的な層は基本的にNxNx7テンソル(各セルが7つの値を保持する行列を想像してください)です。各セルはPとCの値を保持します。 Pは、回帰すべき境界ボックスに関する6つのパラメータであり、Cは信頼度である。
今、私はこのレイヤーで二乗損失を実装したいと思います。紙の状態は最終層の各セルが予測であるため、予測子の位置に境界ボックスを含める必要がある場合は、その予測子(またはセル)のすべてのパラメータに損失を適用する必要があります。バウンディングボックスを含んではならない場合は、信頼度Cを回帰するだけで十分です。
私はTensorFlowで別々の損失を動的に定義する必要がありますが、どうすればできますか?
申し訳ありませんが、私が正しくあなたの問題を理解していない:
私は繰り返しこれを行うことができますか?出力レイヤーのすべてのセルを取り出し、そのセルの損失を決定すること。 – alexovits
@alexovits私は投稿を編集しました – gdelab
私はできるだけ早く試してみます。ありがとう、これは非常に有望に見えます。 TFが時にはどのように文書化されていないのかはちょっと狂っています。 – alexovits