1
私の言葉では、1つの単語が辞書に指定された3つの意味を持つケースがあります。例えば、マケドニア語の "како"という単語は、前置詞、副詞、結合詞のいずれかです。私の質問は、いくつかの文を検索するときに正しい単語の意味を示すことで問題を解決する方法ですか?スタンフォードnlpでいくつかの文法的な意味を持つ言葉?
私の言葉では、1つの単語が辞書に指定された3つの意味を持つケースがあります。例えば、マケドニア語の "како"という単語は、前置詞、副詞、結合詞のいずれかです。私の質問は、いくつかの文を検索するときに正しい単語の意味を示すことで問題を解決する方法ですか?スタンフォードnlpでいくつかの文法的な意味を持つ言葉?
短い答えはできません。
スタンフォードPOSタグリーダーは、双方向アプローチに基づいてタグを計算します。単語のPOSタグは、それが現れるコンテキストに基づいて計算されます。つまり、前後の2つの単語が考慮されます。これに基づいて、アルゴリズムは最も正しいと思われるタグを出力する。 異なる文字セットでは、同じ単語に異なるPOSタグを使用できますが、1つの単語には一度に1つのタグしかありません。ある確率を超えるすべてのタグを取得するオプションはありません。
私が知る限り、まだマケドニア語のモデルはありません。もちろん、独自のモデルを訓練して、ユースケースを正しく処理できるかもしれません。あなた自身のモデルの訓練の詳細については、hereまたはhereを参照してください。
Okey ... POS Taggerを使用してデータベースから単語に存在する可能性のあるすべてのバリエーションを辞書から抽出するにはどうすればよいのですか?その結果、既存の3つの単語例。 –
上記のように、あなたはできません。同じ単語に対して複数のPOSタグを取得する唯一の選択肢は、異なる文脈で同じ単語を含む複数の文章をタグャーに与えることです。 POSタグは単語が現れるコンテキストに基づいて計算されるため、単語に可能なすべてのPOSタグを取得する簡単な方法はありません。 –