Caffeを使用して画像から手書き数字を分類する

mnistの訓練されたLeNetモデルを使用して、与えられた画像から桁を分類しようとしています。私はcpp classification exampleに続き、イメージ（ImageNetデータ）を読み込んで分類しているので、それに従っています。 Imagenetのsysnetファイルがどのようなものであるのか、それがどのように分類に使用されているのか混乱していますか？また、手書きの数字を分類するためのレーベルファイルが必要ですか？もしそうなら、フォーマットを作成する方法とフォーマットはどうすればいいですか？Caffeを使用して画像から手書き数字を分類する

出典

2016-12-16 Kevin George

このトピックに関する良いチュートリアルは、こちらのウェブサイト：http://caffe.berkeleyvision.org/gathered/examples/mnist.htmlです。彼らは私が今まで以上にこれを説明します。

ただし、ラベル付けにはこれを行う方法が複数あります。最も一般的には、画像はフォルダごとに分割されます。次に、1つのフォルダには番号1の画像が、フォルダ2には番号2の画像が表示されます。次に、それを活用してトレーニングデータを読み込むことができます。

ただし、すべてのイメージのラベルファイルを作成し、対応する番号をラベルファイルに書き込むこともできます。ラベルファイルを見つけるために名前スキーマを知っているだけです。

出典

2016-12-16 09:20:20

私はどのように分類するのか疑いがありました。 cpp_classificationへのリンク（問題の場合）では、ラベルファイルでありフォーマットがわからないsynset_words.txtを使用しています。あなたはラベルファイルのフォーマットに関してより具体的になりますか？それは単なる数字ですか？ –

このラベルファイルは数字認識とは関係ありません。これは、imagenetのオブジェクト検出と関係しています。ここからわかるように、IDからオブジェクトクラスへのマッピングです：http://image-net.org/download-API –

Imagenetの画像を分類する際にどのように使用されているのか理解できません。それから、実際にすべてのファイルが、実際に数字の分類に必要なのでしょうか？ Netwrokを定義するprototxtファイル、すべての重みと画像を持つ.caffemodelが必要ですか？ mean_imageファイルは必須か、トレーニング中のみ使用されますか？ –

Caffeを使用して画像から手書き数字を分類する

答えて

関連する問題