私はPrinceton Wordnetデータベースで異なる識別子を理解しようとしています。私はバージョン3.1を使用しています。 hereの構造について読むことができますが、私の焦点はsynsetsです。プリンストンのワードネットデータベース - 2つの異なるsynset識別子?
Synsetテーブルsynsetsテーブルは、データベース内で最も重要なテーブルの1つです。それはWordNet内のすべての定義を格納する責任があります。 synsetid、定義、pos(品詞フィールド)、lexdomainid(lexdomainテーブルにリンクする)の各列には、117373個のsynsetがあります。
感覚表でjoy
という単語を検索すると、4つの異なる結果(2つの名詞と2つのveb)があることがわかります。
「偉大な幸福の感情を」
だから私は今、発見した:そこから、私は私が意味に対応するものである、を探していますことを意味/感覚を識別することができます私が探している結果。この結果のsynset idは107542591
であり、このIDを検索して同じ意味/意味の他の単語を見つけることができます。しかし
、私はWordNetのいくつかのオンラインバージョンを使用して、私はsynset「偉大な幸福の感情」内の単語を検索するとき、私は、識別子の異なるタイプを参照してください。この識別子は07527352-n
です。
たとえば、this siteの左上隅に表示されます。その同じサイトでは、アドレスバーに識別子がsynset id:&synset=07527352-n
と呼ばれることがわかります。
与えられたsynsetの第2のタイプの識別子を取得する方法を知りたいと思います。ドキュメントhereを読んで生データファイルを検索しましたが、わかりません。
ありがとうございました!
ありがとう、それは私が探していたものです。私は精度をチェックしていませんが、このサイトにはあなたが行っているマッピングテーブルがあります:https://hyperdic.net/ja/doc/mapping –