2017-11-28 21 views
0

この記事のタイトルごとに、このページ(https://stanfordnlp.github.io/CoreNLP/history.html)で公開されているStanfordCoreNLPフランスモデルのトレーニングに使用されているデータセットに関する最大限の情報を得たいと考えています。私の最終的な目的は、フランス語で書かれたテキストを特徴付けるためにスタンフォードコアのnlpツールが出力すると期待できるタグのセットを知ることです。私はモデルがツリーバンクを使って訓練されていると言われました。フランス語の言語のために、それらの6は(http://universaldependencies.org/、フランス語のためのセクション)があります: - FTB は - オリジナル - セコイア - ParTUT - PUD - 音声 だから私はだったそれらのどの知っていただきたいと思いますどのフランスのモデルを訓練するのに使用される。利用可能なStanfordCoreNLPフランスモデルは、どのtreebankで利用できますか?

私は最初にこの問題をjava nlpユーザ([email protected])専用のメーリングリストで尋ねましたが、今までは役に立たなかったのです。

これもまた、上述のリンクで利用可能なスタンフォードコアnlpフランスモデルを実際に訓練するために使用されたツリーバンクが1つであると仮定します。あるいは、誰(ここで名前と姓)がこの質問に対する答えを知っているだろうか?ここでは、この興味があるすべての人のために

答えて

0

はスタンフォードCoreNLPでフランス語を使用データセットに関するいくつかの情報は次のとおりです。

French POS tagger: CC (Crabbe and Candito) modified French Treebank 
French POS tagged (UD version): UD 1.3 
French Constituency Parser: CC modified French Treebank 
French NN Dependency Parser: UD 1.3 

はまた選挙パーサparseが選挙を翻訳することはできませんのでご注意依存関係に解析する方法解析し、英語のパーサーパーサーができます。

+0

ありがとう、それは私が探していたものです:) – FrancoisTheFrenchOne

関連する問題