2017-01-29 3 views
1

私はPrinceton Wordnetデータベースで異なる識別子を理解しようとしています。私はバージョン3.1を使用しています。 hereの構造について読むことができますが、私の焦点はsynsetsです。プリンストンのワードネットデータベース - 2つの異なるsynset識別子?

Synsetテーブルsynsetsテーブルは、データベース内で最も重要なテーブルの1つです。それはWordNet内のすべての定義を格納する責任があります。 synsetid、定義、pos(品詞フィールド)、lexdomainid(lexdomainテーブルにリンクする)の各列には、117373個のsynsetがあります。

感覚表でjoyという単語を検索すると、4つの異なる結果(2つの名詞と2つのveb)があることがわかります。

「偉大な幸福の感情を」

だから私は今、発見した:そこから、私は私が意味に対応するものである、を探していますことを意味/感覚を識別することができます私が探している結果。この結果のsynset id107542591であり、このIDを検索して同じ意味/意味の他の単語を見つけることができます。しかし

Screenshot of synset id

、私はWordNetのいくつかのオンラインバージョンを使用して、私はsynset「偉大な幸福の感情」内の単語を検索するとき、私は、識別子の異なるタイプを参照してください。この識別子は07527352-nです。

たとえば、this siteの左上隅に表示されます。その同じサイトでは、アドレスバーに識別子がsynset id:&synset=07527352-nと呼ばれることがわかります。

与えられたsynsetの第2のタイプの識別子を取得する方法を知りたいと思います。ドキュメントhereを読んで生データファイルを検索しましたが、わかりません。

ありがとうございました!

答えて

1

2つのことが起こっています。

最初に、MySQLは0で始まるIDは好きではないので、1から始まります(具体的には、名詞には接頭辞1、動詞2、形容詞3、副詞4に接頭辞が付きます:http://wordnet-rdf.princeton.edu/

2番目の07542591はWordNet 3.1のものです(生のWordNetファイルとSQLファイルの両方をチェックしていますが、どちらもこれを使用しています)。

"07527352"はWordNetの古いバージョンです。中国のWordNetの場合、私はWordNet 3.0を使うと信じています。 http://compling.hss.ntu.edu.sg/cow/

追加:https://stackoverflow.com/a/33348009/841830詳細情報があります。不思議なことに、私は単純な3.0から3.1への変換テーブルをまだ追跡できませんでした...しかし、私はそれを見たと確信しています。

+1

ありがとう、それは私が探していたものです。私は精度をチェックしていませんが、このサイトにはあなたが行っているマッピングテーブルがあります:https://hyperdic.net/ja/doc/mapping –

関連する問題