2017-06-15 7 views

答えて

0

短い答えはできません。

スタンフォードPOSタグリーダーは、双方向アプローチに基づいてタグを計算します。単語のPOSタグは、それが現れるコンテキストに基づいて計算されます。つまり、前後の2つの単語が考慮されます。これに基づいて、アルゴリズムは最も正しいと思われるタグを出力する。 異なる文字セットでは、同じ単語に異なるPOSタグを使用できますが、1つの単語には一度に1つのタグしかありません。ある確率を超えるすべてのタグを取得するオプションはありません。

私が知る限り、まだマケドニア語のモデルはありません。もちろん、独自のモデルを訓練して、ユースケースを正しく処理できるかもしれません。あなた自身のモデルの訓練の詳細については、hereまたはhereを参照してください。

+0

Okey ... POS Taggerを使用してデータベースから単語に存在する可能性のあるすべてのバリエーションを辞書から抽出するにはどうすればよいのですか?その結果、既存の3つの単語例。 –

+0

上記のように、あなたはできません。同じ単語に対して複数のPOSタグを取得する唯一の選択肢は、異なる文脈で同じ単語を含む複数の文章をタグャーに与えることです。 POSタグは単語が現れるコンテキストに基づいて計算されるため、単語に可能なすべてのPOSタグを取得する簡単な方法はありません。 –

関連する問題