私はStanfordNLPで本の長さのテキストブロックを解析しようとしています。 HTTPリクエストはうまく機能しますが、StanfordCoreNLPServer.javaのテキストの長さであるMAX_CHAR_LENGTHは設定できません。StanfordNLPサーバーの文字数制限を100Kにするには?
今のところ、サーバーに送信する前にテキストを切り詰めていますが、文章と段落の間で分割しようとしても、これらのチャンク間で失われる有用な参照情報があります。おそらく、私は大きなオーバーラップを持つチャンクを解析し、それらを結びつけることができますが、それは(1)控えめで、(2)かなりのメンテナンスのようです。
手動チャンクを削除するか、情報をチャンク間で保持するようにサーバーまたはリクエストを構成する方が良いでしょうか?
私はpython要求モジュールを使用してPOSTしていますが、corenlp pythonラッパーが何らかの理由でこの問題を処理しない限り、それは違いになります。
ああ、私は8月から、コミットを参照してください。私はその直前のバージョンを使用しています。私はそれから更新します。ありがとう! –
3.8.0にはありませんか?比較的新しい(つまり、サーバーの最初のバージョンではない)ことは分かっていますが、少なくとも最近のリリースではうまくいけばうまくいけばいいと思います。 –
いいえ、3.8.0のsrcにはまだ静的なMAX_CHAR_LENGTHがあります。 –