追加のカテゴリ/数値機能を使用してCNNモデルをトレーニングする方法は？

-1

RGBの画像そのものに加えて、各画像に添付されたメタデータ/カテゴリ/数値機能のリストもあります。追加のカテゴリ/数値機能を使用してCNNモデルをトレーニングする方法は？

現地時間帯、写真撮影日の曜日、写真のGPS /都市名、写真の簡単な説明（人間が書いたもの）。

テンソルと追加機能を使用してCNNモデルをトレーニングするにはどうすればよいですか？

2017-08-29 samol

一般に、さまざまな機能（画像、時間、説明など）をすべて1つのモデルに柔軟に組み込むことは難しい問題です。 CNNは、画像から情報を抽出する目的でのみ設計されています。畳み込み、プールなどの操作は画像にしか適用できず、一般化を設計するために多くの努力が必要です。

ただし、CNNは画像に含まれる情報を要約するのに役立ちます。あなたの機能としてあなたのCNNの予測を使用し、別のモデルでフィードすることができます。

2017-08-29 21:10:06

これは意味を意味します。だから、私はCNNモデルの出力を使って、別のモデルにフィードして、他のカテゴリ型または連続型のフィーチャと一緒に予測を行います。しかし、あなたはCNNモデルのラベルとして何を使用しますか？言い換えれば、CNNモデルは何を予測していますか？ – samol

ResNetを使用すると、画像にラベルを割り当てることができます。 Fast-RCNNを使用すると、ビデオ内のオブジェクトを検出できます。 CNNとあまりにも多くのことがありますので、1対1の答えはありません。それは本当にあなたのアプリケーションに依存します。 –

答えて