2016-11-29 4 views
1

フランス語の文書で場所の名前を一致させたいと思います。私はMARKFASTを使用しようとしましたが、私はアクセントの感度の問題に直面しています。 places.txtファイルに "Uzès"が含まれているとします。次のように私のRUTAルールは次のとおりです。アクセントを区別しない方法でワードリストを照合することは可能ですか?

PACKAGE my.example; 
DECLARE PlaceName; 
WORDLIST PlaceNamesList = "places.txt"; 

Document{ -> MARKFAST(PlaceName, PlaceNamesList, true)}; 

ルールが正しく、テキストでユゼあるいはユゼスではなく、私が見つけることを期待する形態であるユゼスユゼスを、ユゼと一致します私のテキストで。

これを達成するための正しい解決策は何ですか?すべての地名のアクセントのないバージョンを生成する必要がありますか? (これは私の問題を完全に解決するものではなく、Uzésなどのテキストのアクセントの変化も期待しています。他のRUTAリソース(ワードテーブル、MTWL)はアクセントに対して異なる動作をしますか?

答えて

0

残念ながら、UIMA Ruta(現在2.5.0)は、アクセントを無視したマッチングをサポートしていません。

ワードリストを展開する(プログラムで)か、別の注釈を使用する必要があります。

免責事項:私はUIMAルタ

+1

感謝の開発者です。私は現在、アクセントに敏感な辞書注釈が存在しないのではないかと心配しています。私はRuta "前処理"としてそれを含めることができるように、1つを構築してUimaFitコンポーネントとしてパッケージ化します。 –

関連する問題