プロジェクトに何か他のものがありますが、プロジェクトにOCRが必要な場合は、これを行うサードパーティのツールを検索する必要があります。しかし、あなたのプロジェクトがこれであり、自分でそれをしたいのなら、この答えをお読みください:
文字を認識するには2通りの方法があります。オンラインとオフライン
オンラインウェイは、ペン(またはマウス)入力データを使用します。オフラインの方法ではピクセルだけが使用されます。
あなたの最初のステップは、そのいずれかから選択します。オフラインの方法ではペンのデータがありませんが、これは便利な機能です。オフラインでは、イメージファイルの文字を認識することができます(ペイント、保存、またはスキャンによって作成されます)
第2に、データを前処理する必要があります(この手順はオフラインでのみ行います)。そこからノイズを除去し、スケールして、そこに薄くする必要があります。
次に、前処理されたデータ(オンラインまたはオフライン)から有用な機能を抽出する必要があります。このために、光学式文字認識に関する記事やその抽出をお読みいただけます。前処理と特徴抽出についての良いパワーポイントの提示があるhere。また、pdf
のキーワードと、filetype:pdf
がGoogleの検索語の最後に表示されます。
次に、ニューラルネットワークなどを使用して文字を認識する必要があります。入力は特徴を抽出する必要があります。
しかし、このプロジェクトは簡単ではなく、時間がかかることを忘れないでください! (これはペルシア語の私のプロジェクトでした)
私は絶対に特徴抽出を必要としません。バックプロップネットワークでは、入力レイヤーは単純に入力ピクセルあたり1つのニューロンである場合があります。 – Novak
@Novak真実かもしれません。非常に大きく、良い入力が必要です。誤った文字や悪い騒音であっても、ひどい訓練をすることができるからです。そして、それは位置とサイズに敏感です。私はフィーチャー(投影ヒストグラムのようなシンプルさえも)を使用して、事前処理されたイメージからイメージを抽出することをお勧めします。それは検出率を高めることができるので... –
合意。元のポスターがパフォーマンスを求めているのか、それとも単なる自己指導だったのかははっきりしていませんでした。 – Novak