2012-06-15 4 views
6

Aspellでは、アンダースコアまたはダッシュを含む単語は2つとみなされます。クラウドベースは "クラウド"と "ベース"とスペルチェックされます。ダッシュとアンダースコアを除外するように単語デリミタを指定する方法はありますか?アスペルの単語区切り記号を定義する方法は?

+0

[こちら](http://aspell.net/man-html/Words-With-Symbols-in-Them.html#Words-With-Symbols-in-Them)をお探しですか? – Qnan

+0

@Mikhailそれのようなもの。この記事では、どの文字を単語境界にするか、どの文字を単語境界にするかについては説明していませんが、私は、クラウドベースが1つの単語であると思うように思っています。たとえば、「cluod-based」のようなスペルミスがある場合、「cluod」だけでなく、単語全体を返すようにします。それは理にかなっていますか? – mart1n

+0

私はダッシュをすべて「文字」として扱うのは好きではないでしょうか? – Qnan

答えて

2

私が質問を正しく理解していれば、Aspellはあなたが望むもの(私の知る限り)を正確に行うことはできません。これは条件付き複合語処理との関係であり、Aspells TODO listにあります。

同じリストには、Hunspellが複合語でより良い仕事をしていることが記載されています。したがって、あなたがアスペルに拘束されていない場合は実行可能な選択肢になるかもしれません。 OpenOfficeでは、スペルチェックにHunspellを使用しているため、要件に適合しているかどうかを簡単に確認できます。少なくとも「cluod-based」の例では動作し、ハイフネーションされたすべての単語を無条件のコンパウンドとみなさない。つまり、「based-cloud」はスペルミスとはみなされない。

+0

あなたの答えをありがとう。たぶん私はhunspellを見ています。 – mart1n

0

この時点で、Aspellはあなたがしたいことをすることができません。その中のシンボルで単語を処理するために使用するインタフェースは、この時点でそのようなケースを処理するのに十分な洗練されたものではありません。この詳細については、hereを参照してください。

申し訳ありませんが、独自のインターフェイスを実装したい場合を除き、この時点までは解決できません。 Hunspellの使用をお勧めします。Mikhailが提案されています。

関連する問題