私はnltk
を初めて利用しています。 synsets
、hypernyms
、などがありますが、「デリー」 - 「ハイデラバード」のような場所間の類似性は、明らかにこれらの単語がワードネットコーパスに含まれていないためはありません。wordnetで別のテキストに?
なので、何とか私がwordnet corpusを更新するか、wordnetを別のコーパスで作成できるかどうかを知りたいと思います。旅行に関連するウィキペディアから抽出されたページのセット?異なるコーパスを介してワードネットを作成することができれば、フォーマットとは何か、同じことを実行するステップ、何らかの制限がありますか?
上記の懸案事項を説明するリンクを教えてください。私はインターネットを検索した、グーグル、nltk本の一部を読んで、私は上記の質問へのヒントを持っていない。
ご質問が完全にばかげている場合は、私を許してください。デリーやハイデラバードなどの非常に特定の用語の意味的な類似性を測定する際の柔軟性を高めるために
チェック - DBpedia – RAVI