2011-10-21 21 views
0

私は最終的なプロジェクトに取り組んでいます。私は文字認識のためにNNを実装することを選択しました。Matlabニューラルネットワークの文字認識

私の計画は、トレーニングデータとして26の英字を含む26の画像を取ることですが、これらの画像をニューラルネットワークへの入力としてどのように変換するかはわかりません。

私は、隠れ層と出力層の2つの層を持つバックプロパゲーションニューラルネットワークを持っているとしましょう。出力層には26の文字を生成する26個のニューロンがあります。私は自分自身が英語の文字を含む26の画像(サイズは100×100ピクセルの24ビットbmp形式)を作りました。私は画像の分割を行う必要はありません。私は画像処理の初心者ですから、画像をMATLABの入力ベクトルに変換する方法についていくつか提案してもらえますか(または、エッジ、モフォロジーまたは他の画像を行う必要がありますか前処理のもの?)。

ありがとうございます。

+0

トレーニングセットに合わせたいと思っている場合を除き、これは十分なデータではありません。データには数桁のデータが必要です。この(よく研究された)アプリケーション分野の論文をすばやく読んで、それをあなたに納得させるはずです。 –

答えて

2

NNは、文字が同じ(ピクセルの位置が固定されている)場合にのみ機能します。画像をグレースケールに変換してピクセル化する必要があります。つまり、四角形の画像を分割するグリッドを使用します。正方形は文字の細部を得るのに十分な大きさである必要がありますが、大きすぎるほど多くのニューロンを使用しないように十分大きくなければなりません。各ピクセル(グレースケール)は、NNの入力です。残されているのは、ニューロン(例えばNNトポロジー)を接続する方法を決定することである。 2層のNNで十分である。おそらくあなたは、第一層の各ニューロンとこれが直接あなたが質問に答えていない第二層

0

の各ニューロンへの第一層の各ニューロンへの各入力「ピクセル」を接続する必要がありますが、役に立つかもしれません。

1)より多くのトレーニングデータが必要です。私があなたを正しく理解していれば、もっと多くの情報を得ることができます(各レターのサンプルは1つだけです)。

2)これはかなり一般的なプロジェクトであり、許可されていれば、インターネットでNNコンポーネントに集中することができます。

+0

ありがとうuser670416、私は自分で変換する方法を理解しようとします。多分私はビットマップを使用することができます。私は画像処理の学生ではないNNの学生です。イメージのやり方にもっと力を入れたいとは思っていません。 – Alex

0

あなたは文字認識を行うので、訓練データを必要としないSOMニューラルネットワークを使用することをお勧めします。それぞれの手紙には26個の入力ニューロンがあります。画像処理ビットの場合、Rossは各文字を分離するのに役立つ提案をしています。

関連する問題