2017-12-13 7 views
4

手のRGB画像と手のキーポイントの3D位置がデータセットとして与えられているので、DLの回帰問題としてこれを行いたいと思います。この場合、入力はRGB画像になり、出力はキーポイントの3D位置を推定する必要があります。
回帰に関するいくつかの情報を見てきましたが、そのほとんどが単一の値を推定しようとしています。一度に複数の値(または出力)を見積もることは可能ですか?ディープラーニングを用いた回帰における多重出力の取得

今のところ私はこれをcodeと言いました。この男はイメージの人の年齢を推定しようとしています。

答えて

1

ニューラルネットからの出力ベクトルは、損失関数をよく定義する限り、何でも表すことができます。 10個のキーポイントの(x、y、z)座標を検出したいとし、30要素長の出力ベクトルsay(x1、y1、z1、x2、y2、z2 .......... ...、x10、y10、z10)ここでxi、yi、ziはi番目のキーポイントの座標を表します。あなたの損失機能に注意してください。 RMSEの損失を計算したい場合は、正しくトリップを抽出し、各キーポイントのRMSE損失を計算する必要があります。線形代数に慣れている場合は、3x10行列に正しく再構成し、結果を3x10マトリックスを使用してから使用してください。

loss = tf.sqrt(tf.reduce_mean(tf.squared_difference(Y1, Y2))) 

しかし、いったんネットを策定したら、それに固執する必要があります。

+0

ありがとう!あなたのコメントと[this](https://qiita.com/cvusk/items/1439c1c6dde160c48d13)が私の問題を解決しました。 – Theodore

関連する問題