1
フランス語の文書で場所の名前を一致させたいと思います。私はMARKFASTを使用しようとしましたが、私はアクセントの感度の問題に直面しています。 places.txt
ファイルに "Uzès
"が含まれているとします。次のように私のRUTAルールは次のとおりです。アクセントを区別しない方法でワードリストを照合することは可能ですか?
PACKAGE my.example;
DECLARE PlaceName;
WORDLIST PlaceNamesList = "places.txt";
Document{ -> MARKFAST(PlaceName, PlaceNamesList, true)};
ルールが正しく、テキストでユゼあるいはユゼスではなく、私が見つけることを期待する形態であるユゼスもユゼスを、ユゼと一致します私のテキストで。
これを達成するための正しい解決策は何ですか?すべての地名のアクセントのないバージョンを生成する必要がありますか? (これは私の問題を完全に解決するものではなく、Uzésなどのテキストのアクセントの変化も期待しています。他のRUTAリソース(ワードテーブル、MTWL)はアクセントに対して異なる動作をしますか?
感謝の開発者です。私は現在、アクセントに敏感な辞書注釈が存在しないのではないかと心配しています。私はRuta "前処理"としてそれを含めることができるように、1つを構築してUimaFitコンポーネントとしてパッケージ化します。 –