私がしようとしているのは、手書きの英語の単語を個々の文字に分割することです。私はMatlabのでこれをコーディングしていますニューラルネットワークを使った手書き単語分割
:私はこのような基本的なオーバーセグメンテーション単語の何かをする人工知能を持つ単純なヒューリスティックなアプローチを適用しています。このアプローチには、前処理、傾き補正サイズの正規化などが含まれ、次にペンストロークを1ピクセル幅に間引きし、画像のピクセルの列合計を使用して画像に存在する合字を識別します。画素総和が閾値より低い各列は、可能なセグメンテーション点である。問題は、 'u'、 'v'、m '' n '、' w 'のような開いた文字もピクセルの列合計が小さく、セグメント化されます。私はセグメント化されたポイントを介してこれらを修正するために、ニューラルネットワークを使用し、悪いとしてそれらを認識する必要があり、この配置を改善するために、今すぐ
cursive script segmentation using neural networks.
:私が使用している アプローチは、この論文で提示されているものの修正版ですセグメンテーション。私はそのために 'newff'関数を書いて、セグメントを手動で良いものと基本的なものにラベル付けしますが、そのニューラルネットワークへの入力となるべきものを理解することはできません。
可能性のあるセグメントが作成される列番号(トレーニングサンプル1つにつき1つのセグメンテーションポイント)があります。画像には約40個のセグメンテーションポイントがあり、40個のトレーニングサンプルにつながります)、それを訓練のための良いセグメントまたは悪いセグメントとしてラベル付けします。
セグメンテーションポイントが良いか悪いかを伝える出力ニューロンが1つだけあります。
すべての列の列合計を入力層の入力として与えることはできますか?このトレーニングインスタンスのセグメンテーションポイントを教えてください。私たちがこのn次元入力の海に溺れている最も重要な値である良いまたは悪いセグメントとして分類しなければならない実際の列番号ではありませんか? (nは画像のピクセル幅)