2017-02-01 7 views
0

私は今日、深い学習の特別な畳み込みニューラルネットワーク(CNN)があらゆる分野で使われているという一般的な質問をしたいと思います。場合によっては、問題にCNNを使用する必要はありませんが、研究者は傾向を使用しており、それに従っています。なぜオブジェクト検出にCNNが必要なのですか?

オブジェクト検出の問題では、CNNが検出の問題を解決するために本当に必要とされるのは一種の問題ですか?

答えて

1

これは不幸な質問です。タイトルではCNNについて聞いていますが、一般的に深い学習について質問します。

したがって、オブジェクト認識のための深い学習は必要ありません。しかし、訓練された深いネットワークはよりよい結果をもたらします。 Googleなどの企業は、より良い成果を得るたびに感謝しています。

CNNについては、「従来の」ANNよりも優れた結果を示し、重みの共有のためにパラメータも少なくなっています。 CNNは転送の学習も可能にします(あなたは、フィーチャディテクタのコンボリューションとレイヤーのプールを行い、フィーチャディテクタには完全に接続されたレイヤーを接続するよりも)。

+0

はい、私は質問を修正しました。しかし、私が尋ねたいことは、CNNを特定の問題に使用するための基準があるかどうかです。間違いなく、CNNは、性能が良くなるが、あなたは、物体検出&認識や音声認識を行う場合、それはまた、トレーニングやメモリ – Addee

+0

はいのために長い時間がかかります。これらのネットワークは、画像や音声によるフィールド作業に常に使用されます。 – viceriel

+0

基準、いいえ。たぶんお勧めです。 MLPは悪い結果で同じタスクを実行できます。あなたのアプリケーションが画像/音声で作業しているときは、CNNの使用を検討することができます。 – viceriel

1

CNNの重要な概念は、翻訳の不変性です。要するに、画像に畳み込みカーネルを使用すると、マシンが(ネットワークの階層化に応じて、エッジ、またはより詳細なオブジェクト)特定の機能のための重みのセットを学習し、画像全体に適用することを可能にします。 画像内の猫を検出することを検討してください。学習者が猫を認識できるようにいくつかの体重を設計した場合、猫がどこにいるかに関わらず、体重が同じであることを望みます!そこで、畳み込みカーネル内のレイヤーをネコを検出するのに「割り当てる」ようにしてから、画像全体に畳み込みます。

何であれCNNの最近の成功の理由、定期的に完全に接続されたANNのは、全く同じように実行しなければならないことに留意すべきです。問題は、大きな画像では計算上実行不能になりがちですが、CNNはパラメータ共有の方がはるかに効率的です。

関連する問題