0

私は自分の訓練データセットを収集して画像検出(認識)にしようとしています。今は、それぞれ4つのクラスと750の画像があります。各画像は、各クラスの単なる通常の画像です。しかし、一部の画像はぼやけているか、背景や他の要因などの外側のオブジェクトを含んでいます(ただし、区別できるものはありません)。そのトレーニングデータセットを使用すると、画像認識は本当に悪いことです。TensorFlow:自分の訓練データセットを収集する&その訓練データセットを使用してオブジェクトの場所を見つける

私の質問は、 です。1.トレーニング画像セットは、さまざまな背景/設定/環境(私は信じていません...)でオブジェクトを含む必要がありますか? 2.トレーニングがかなり正確に機能し、画像上のオブジェクトの位置を知りたいとします。私は、画像認識だけを使用して位置を見つける方法がないと考えています。したがって、境界ボックスを使用すると、コード内でどのように境界ボックスの位置を見ることができますか?

ありがとうございます!

答えて

0

あなたのプログラマーがクラスごとにどのような特徴を学習するのかを事前に知ることは難しいです。しかし、あなたの目に見えないイメージが同じバックグラウンドにある場合、バックグラウンドは何の役にも立たないでしょう。私はトレーニングでデータの増強を提案します。無作為に色の歪み、ランダムな反転、ランダムな切り取り。

境界ボックスがどこにあるのかはコード内には表示されません。例えば、LabelMeのようなツールを使って、収集したデータの中で自分自身にラベル付け/注釈を付ける必要があります。その後、物体検出器の学習が始まります。

関連する問題