2016-08-09 4 views
0

旧バージョンのWordnet(1.6)を現在のバージョン(3.0)に、好ましくはNLTKを使用して、どのようにマッピングするのですか?旧バージョンのWordNetからsynset idをマッピングする

たとえば、1.6の場合、怒りはオフセット5588321を持ち、3.0は7516905を返します。

これは主に、バージョン1.6を使用するWordnet-Affect http://wndomains.fbk.eu/wnaffect.html を実装することでした。

私はhttps://github.com/clemtoy/WNAffectでリポジトリを見つけることができました。これは、WordNetの影響を使用する要件の問題を解決するデータベースを使用できましたが、達成するためにsynsetをマップしませんでした。同様に役立つであろうWordNetの1.6のためにそのIDからsynsetの名前を取得

wn.synset('wrath.n.01').offset() 
7516905 

EDIT、WordNetの3.0オフセットNLTKましょう。

EDIT2:ここ

は、情報が正確に保存されている方法です。これは小さなサブセットである -

<noun-syn id="n#05588321" categ="wrath"/> 
<noun-syn id="n#05576115" categ="worship"/> 
<noun-syn id="n#05600844" categ="world-weariness"/> 
<noun-syn id="n#05582577" categ="wonder"/> 
<noun-syn id="n#05600968" categ="woe"/> 
<noun-syn id="n#05579569" categ="withdrawal"/> 
<noun-syn id="n#05604301" categ="weight"/> 
<noun-syn id="n#05601315" categ="weepiness"/> 
<noun-syn id="n#05574157" categ="weakness"/> 
<noun-syn id="n#05611809" categ="warpath"/> 

あなたはそれを明白な方法を行う必要があるように誰もがショートカットを示唆していないので、これらのIDは、すべてに古いWN1.6のIDS

+1

興味深い質問です。対応するsynsetの例やマッピングを必要とするそれらの使用を含め、状況に関する詳細情報を提供できますか? 2つのバージョンのワードネットを横たえている人はほとんどいないので、必要な情報をすべて提供すれば、助けを受ける可能性は非常に高いです。 – alexis

+0

私はいくつかの詳細を追加しました:) –

+0

これは始まりですが、私はnltkでうっかりWordnetを使用しましたが、私は "オフセット"について聞いたことがありません。使用可能なコードを与える!重要な点は、人々が(それが何であれ)ワードネットに影響を与えない人を助けることができるようにすることです。 – alexis

答えて

1

あり、聞こえる:1.6 WordNetのを起動し、 synsetへのオフセットを自分で変換します。あなたは、私は彼らが、下位互換性を維持しようとしたいかに難しいかは考えを持っていないしましたが、うまくいけばwrath.n.01がWordNetのすべてのバージョンでも同じこと多かれ少なかれあるthis page.

にWordNetのの公式バージョン1.6のダウンロードを見つけることができます。私はいくつかの感覚がバージョン間で2つ以上のsynsetsに分割されていたことを推測しています。そのような場合には、元のsynsetの正確な対応物のようなものは存在しません。それがあなたにとって問題かどうかは、あなたが決定することです。

関連する問題