2016-04-29 11 views
1

私がStanford Parserを使って文章を解析すると、 "JiríHubacのスクリプトは宝石です。" "AndréTurpinによる吸収学の研究"多言語である文章を解析するには?

内部エラーが発生します。

このような状況に対処するには、文章は多言語ですか?ここで使用可能なフルスタンフォードCoreNLPツールキットの使い方

答えて

1

http://stanfordnlp.github.io/CoreNLP/

私は、このコマンドを実行した:

java -Xmx6g -cp "stanford-corenlp-full-2015-12-09/*" edu.stanford.nlp.pipeline.StanfordCoreNLP -annotators tokenize,ssplit,pos,lemma,ner,parse -file example.txt -outputFormat text 

それはあなたの例文を解析は問題がありませんでしたし、出力はで見つけることができますファイル:

example.txt.outあなたが発行されたコマンドと実行しようとしたときにあなたが得たエラーを提供してもらえこの文に?

+0

私はちょうど提供されるコマンド「コードserver.parse(」いくつかの文「)」で[リンク](https://github.com/dasmith/stanford-corenlp-python)に設けられたPythonインタフェースを使用@StanfodNLPHelpインラインの 'backticksのコード' – Matthew

+0

私はそのPythonラッパーを使用しません。 Stanford CoreNLPサーバーを使用することもできます:http://stanfordnlp.github.io/CoreNLP/corenlp-server.htmlこのPythonラッパーを使用してください:https://github.com/smilli/py-corenlp ...あなたが単にos.system()呼び出しで上記で提供したコマンドを使用して、出力を処理するだけの文章をたくさん処理したいのであれば注意してください...私たちのツールキットの代わりに "-outputFormat json"処理された文のjsonを出力します – StanfordNLPHelp

+0

@StanfodNLPHelpこれは私にとって大きな助けになります。また、スタンフォードパーサーから二値化された構文解析ツリーを取得するにはどうすればよいですか?このためのパラメータはありますか?ありがとうございました! – Matthew

関連する問題