2016-07-11 7 views
1

OCRプログラムでは、大文字のOが誤ってゼロとして認識されることがあります。たとえば、Overを0verまたはWe11と認識します。Hunspell接尾辞ファイルを変更して数字の単語を許可するにはどうすればよいですか?

私は、接辞ファイルに

REP 0 O 
REP 1 l 

を追加しようとしましたが、数字は明らかに単語の境界と考えられているので、それは動作しませんでした。

は(私は hunspell man pageを見ていたが、私は言葉に番号を許可するように変更する必要があり、多くの設定のどちらを見つけ出すことはできません。)のマンページから

答えて

1

REP何replacement この表では、最初に試行する変更を指定します。最初のREPは で、このテーブルのヘッダーと1つ以上のREPデータラインは です。この表を使用すると、誤った書式 が正しい書式から1文字以上異なる場合、Hunspellは典型的なスペルミスのために正しい 書式を提案できます。検索 文字列は、正規表現の境界記号(^と$)をサポートしています。たとえば について スペルミス子音を処理するための可能な英語の置換テーブルの定義:

  REP 5 
      REP f ph 
      REP ph f 
      REP tion$ shun 
      REP ^cooccurr co-occurr 
      REP ^alot$ a_lot 

あなたが最初の行、代替品のREP +番号を追加しましたか?

+0

あなたの答えをありがとう。私は、次のエントリの数でヘッダを追加し、他のすべてのREP文が機能します。何がうまくいかない: 'REP 0 O' –

+0

hunspellはREPの後ろに整数があり、それを置換えの代わりにヘッダとして解釈する可能性があると思いますか?その場合、最後にゼロ置換を配置するとうまくいく可能性がありますが、それはHunspellの実装を監視しているのではないかと恐れています。 –

+0

あなたはおそらく正しいでしょう。 HunspellパーサーはおそらくREPステートメントの数字で混乱します。 –

関連する問題