2016-10-01 12 views
1

私はCoreNLPサーバーを使用して複数の文に注釈を付そうとしています。私は取得していますあまりにも多くの文章でそれをしようとした場合しかし、:edu.stanford.nlp.io.RuntimeIOException:サーバーに接続できませんでした

Exception in thread "Thread-48" edu.stanford.nlp.io.RuntimeIOException: Could not connect to server: 192.168.108.60:9000 
    at edu.stanford.nlp.pipeline.StanfordCoreNLPClient$2.run(StanfordCoreNLPClient.java:393) 
Caused by: java.io.IOException: Server returned HTTP response code: 500 for URL: http://192.168.108.60:9000?properties=%7B+%22inputFormat%22%3A+%22serialized%22%2C+%22outputSerializer%22%3A+%22edu.stanford.nlp.pipeline.ProtobufAnnotationSerializer%22%2C+%22inputSerializer%22%3A+%22edu.stanford.nlp.pipeline.ProtobufAnnotationSerializer%22%2C+%22annotators%22%3A+%22tokenize%2C+ssplit%2C+pos%2C+lemma%2C+ner%2C+parse%2C+dcoref%22%2C+%22outputFormat%22%3A+%22serialized%22+%7D 
    at sun.net.www.protocol.http.HttpURLConnection.getInputStream0(HttpURLConnection.java:1840) 
    at sun.net.www.protocol.http.HttpURLConnection.getInputStream(HttpURLConnection.java:1441) 
    at edu.stanford.nlp.pipeline.StanfordCoreNLPClient$2.run(StanfordCoreNLPClient.java:381) 

すべてが働いている私はちょうど10か20の文章のためにこれを実行する場合は、それらの数が大きくなるように、サーバーがいるようです崩壊してタイムアウト限度に達しています。少なくともこれが私が持っている唯一の説明です。

StanfordCoreNLPClient coreNlp = new StanfordCoreNLPClient(props, "192.168.108.60", 9000); 

// .. 

for(int windowSize : windowSizeList) { 

    Map<String, List<TaggedSentence>> aspectMap = new HashMap<>(); 

    for (int i = 0; i < sentenceList.size(); i++) { 

     Annotation document = sentenceList.get(i); 

     try { 
      coreNlp.annotate(document); 
     } catch(Exception e) { 
      LOGGER.error("Error", e); 
     } 

     // ... 
    } 
} 

どうすればこの問題を解決できますか?


は編集:

props.setProperty("timeout", "50000"); 

が、それが解決しない:さて、私はそこにタイムアウトオプションであることがわかりました。それはとにかく失敗している - それはちょっと時間がかかる。

+0

あなたは3.6.0リリースを使用していますか、GitHubからコンパイルしていますか?これに役立つかもしれない3.6.0以降に組み込まれた一連の安定性修正があります。 –

答えて

0

私は同様の問題がありました。私の場合、同一指示の解像度を使用していたと私は、次のアノテーター使用することによって解決:

  • または、以下のようなコマンドラインcoref、トークン化、ssplit、POS、補題、NER、depparse、言及を:

のjava -cp -Xmx5gスタンフォード-corenlp-3.6.0.jar:スタンフォード-corenlp-モデル-3.6.0.jar:* edu.stanford.nlp.pipeline.StanfordCoreNLP -annotatorsトークン化、ssplit、POS 、lessmma、ner、depparse、coref-file example_file.txt

このページによれば、(速度に関して)効率が良いからです。http://stanfordnlp.github.io/CoreNLP/coref.html#overview

関連する問題