私は非常に(非常に)初心者であり、ANNと読むのはthis tutorialです。著者は次のOCRの例についてANNを説明します。ニューラルネットワークを用いた数字認識の具体例
8x8グリッドに等しいセル(セルは常に同じサイズ)を持つバイナリイメージがあります。すべての数字はグリッドのいくつかのセルを使用して形成されます。すべての画像に数字のいずれかがあります0-9
さらに、訓練されたすべての桁が同じ8x8グリッド(例えば、訓練された桁のベクトル4
=認識された桁のベクトル4
)を持つと仮定します。例えば
そこで彼は、我々は64個の入力(すべてのグリッドセルのための1つの入力を)必要があると述べています。 10個の出力ノードが必要です(10桁があります)。 1つの隠れノードの層があると考えられます。しかし、私はこのすべての結果がどのように作用するのか理解できません。
私たちが必要とする隠れたノードの数と、これらの隠されたノードは何をする必要がありますか?
P.S. OCR処理の前処理、セグメンテーション、プレゼンテーションのすべてを支援する必要はありません。我々は既に長さ64の特徴のベクトルを持っています。