2017-08-29 11 views
-1

RGBの画像そのものに加えて、各画像に添付されたメタデータ/カテゴリ/数値機能のリストもあります。追加のカテゴリ/数値機能を使用してCNNモデルをトレーニングする方法は?

現地時間帯、写真撮影日の曜日、写真のGPS /都市名、写真の簡単な説明(人間が書いたもの)。

テンソルと追加機能を使用してCNNモデルをトレーニングするにはどうすればよいですか?

答えて

0

一般に、さまざまな機能(画像、時間、説明など)をすべて1つのモデルに柔軟に組み込むことは難しい問題です。 CNNは、画像から情報を抽出する目的でのみ設計されています。畳み込み、プールなどの操作は画像にしか適用できず、一般化を設計するために多くの努力が必要です。

ただし、CNNは画像に含まれる情報を要約するのに役立ちます。あなたの機能としてあなたのCNNの予測を使用し、別のモデルでフィードすることができます。

+0

これは意味を意味します。だから、私はCNNモデルの出力を使って、別のモデルにフィードして、他のカテゴリ型または連続型のフィーチャと一緒に予測を行います。しかし、あなたはCNNモデルのラベルとして何を使用しますか?言い換えれば、CNNモデルは何を予測していますか? – samol

+0

ResNetを使用すると、画像にラベルを割り当てることができます。 Fast-RCNNを使用すると、ビデオ内のオブジェクトを検出できます。 CNNとあまりにも多くのことがありますので、1対1の答えはありません。それは本当にあなたのアプリケーションに依存します。 –

関連する問題