2017-01-19 33 views
0

私はMS Office Document Imaging [MODI]を使用してjpeg形式のテキストを解析しています。 MODIが画像からテキストを読む能力の限界をスケッチできる人はいますか?MODIの精度

答えて

0

Windows 10では、2番目のOCRオプションMicrosoft.Windows.Ocrが提供されています。そのMSDN pageには、機能と制限に関するいくつかの詳細な仕様が含まれています。

OCRエンジンは、画像上のすべてのテキストが同じ方向に書き込まれていることを前提としています。 テキスト認識の精度は、画像の品質によって異なります。不正確な読み取りは、以下によって引き起こされることがあります

  • ぼやけ画像手書きまたは筆記体のテキスト
  • 芸術フォントスタイル
  • 小さなテキストサイズ(西洋言語未満15個のピクセル、または未満20個の 画素テキストの上に東アジア言語)
  • 複雑な背景の影や映り込み
  • 遠近歪み
  • 特大またはSの単語の先頭に大文字を落としましたあなたはそれを自分でテストしたい場合はubscript、上付き文字、または取り消し線テキスト

、Visual StudioのC#テストプロジェクトは、ここで見つけることができます:GUI front-end for the Microsoft OCR library.アプリケーションはまた、読書やOCR'ingのPDFファイルのサポートが含まれています。