CoreNLPを使用したフランス語の依存関係解析

フランス語のテキストにStanford CoreNLPを使用しようとしています。 POSのタグ付けと解析は正常に動作しますが、私の設定では、出力の依存関係はまったく意味がありません。私はフランス人モデルとCoreNLP 3.6を使用していCoreNLPを使用したフランス語の依存関係解析

annotators = tokenize, ssplit, pos, depparse, parse 
tokenize.language = fr 
pos.model = edu/stanford/nlp/models/pos-tagger/french/french.tagger 
parse.model = edu/stanford/nlp/models/lexparser/frenchFactored.ser.gz 
depparse.model = edu/stanford/nlp/models/parser/nndep/UD_French.gz

がhereが見つかりました：

私のコマンドはfrench.confが含まれてい

java -mx1g -cp "~/stanford-corenlp/stanford-corenlp-full-2015-12-09/*" 
edu.stanford.nlp.pipeline.StanfordCoreNLP -props french.conf 
-file /tmp/file.txt -outputFormat text

です。ログには、その点で正常に見える：

[main] INFO edu.stanford.nlp.pipeline.StanfordCoreNLP - Adding annotator tokenize 
[main] INFO edu.stanford.nlp.pipeline.StanfordCoreNLP - Adding annotator ssplit 
[main] INFO edu.stanford.nlp.pipeline.StanfordCoreNLP - Adding annotator pos 
Reading POS tagger model from edu/stanford/nlp/models/pos-tagger/french/french.tagger ... done [0,2 sec]. 
[main] INFO edu.stanford.nlp.pipeline.StanfordCoreNLP - Adding annotator depparse 
Loading depparse model file: edu/stanford/nlp/models/parser/nndep/UD_French.gz ... 
PreComputed 100000, Elapsed Time: 1.43 (s) 
Initializing dependency parser done [3,4 sec]. 
[main] INFO edu.stanford.nlp.pipeline.StanfordCoreNLP - Adding annotator parse 
[main] INFO edu.stanford.nlp.parser.common.ParserGrammar -  Loading parser from serialized file edu/stanford/nlp/models/lexparser/frenchFactored.ser.gz ... 
done [3,0 sec].

が、ここで

root(ROOT-0, chat-2) 
det(chat-2, Le-1) 
case(souris-5, mange-3) 
det(souris-5, la-4) 
nmod:mange(chat-2, souris-5) 
punct(chat-2, .-6)

（まったく同じ構造で、猫がマウスを食べている）「をル疥癬ラ・スリスチャット」との結果であります
これは単なるナンセンスです。これは例外的なことではありません。私は多くの文章をテストし、常にこのような出力を得ました。そのため、私は悪い設定ファイルを使用していると思います。

助けていただけたら幸いです！

出典

2016-04-14 jpl

解決策を見つけましたか？ @jpl – zwlayer

これは、CoreNLP依存性パーサーがUniversal Dependencies POSタグを取得し、CoreNLPが提供するフランス語POSタガーがフランスのTreebank POSタグを出力するためです。

私はユニバーサル依存POSタグを取得するために、フランスのPOSタガーの出力を変換したパッチ作りました。興味があるものについてはhttps://github.com/askplatypus/CoreNLP/commit/e6215bdc5d4903bc3e2d2fb533da7e3938fa825f

出典

2016-09-16 13:26:33 Tpt

を、スタンフォードCoreNLPは今、彼らのモデルを更新したと、彼らはかなりよく働きます今。

出典

2017-04-14 07:39:45 jpl

CoreNLPを使用したフランス語の依存関係解析

答えて

関連する問題