最近オントロジーで作業を始めました。私は自動的に文字列を分類するためにも使いたいオントロジを作成するためにProtegeを使用しています。以下は、非常に基本的なクラス階層を示していますオントロジーベースの文字列の分類
String
|_ AlphabeticString
|_ CountryName
|_ CityName
|_ AlphaNumericString
|_ PrefixedNumericString
|_ NumericString
は、最終的にSpain
のような文字列がCountryName
またはUE4564
として分類されるべきであるPrefixedNumericString
だろう。
しかし、この知識をどのようにモデル化するかはわかりません。文字が英字、数字などであるかどうかを最初に定義してから、既存の文字から単語を作成するか、Regexesを使う方法がありますか?これまでは、String and hasString value "UE4565"
のような正確なフレーズに基づいて文字列を分類することしかできませんでした。
または、オントロジの各クラスの正規表現を安全にし、その正規表現を使用してJavaで文字列を分類する方が良いでしょうか?
文字列は都市名と国名の両方にすることができます(概念的にはこれまでの説明に基づいています)。オントロジーは単一の継承を持つ必要はありません。 –