stanford-nlp

    1

    3答えて

    まれな入力ドキュメントでOOMエラーが発生するNLPライブラリ(Stanford NER)を使用しています。 最終的にこれらのドキュメントを分離し、エラーの原因を突き止める予定ですが、これは難しいです(私はHadoopで動作しているので、エラーは179%そんな感じ)。暫定的な解決策として、私はこの特定の呼び出しにCPUとメモリの制限を適用できるようにしたいと思います。 私はこれを行うための最善の方

    141

    9答えて

    スタンフォードNLPは、hereをデモを行っ次のような出力が得られます。 Colorless/JJ green/JJ ideas/NNS sleep/VBP furiously/RB ./. 音声タグの一部は何を意味するのですか?私は公式のリストを見つけることができません。スタンフォード独自のシステムですか、普遍的なタグを使用していますか? (例えば、JJとは何ですか?) また、文章を繰り返し

    2

    1答えて

    私は自然言語処理のプロジェクトを持っていましたが、Yahooのニュース、Googleニュース、ブログなどのいくつかのソースから多くのWeb記事をクロールする必要があります... 私はJava開発者ですむしろJavaツールを使用してください)。私は自分自身で各ソースWebサイトを解析し、HttpClient/XPathで記事を抽出することができますが、私は少し怠惰です:)ソースが1つのパーサを作る必

    1

    2答えて

    Webサービスでスタンフォードパーサーを使用する必要があります。 SentenceParserが大きなオブジェクトを読み込むとき、私はそれがシングルトンであることを確認しますが、この場合はスレッドセーフです(http://nlp.stanford.edu/software/parser-faq.shtmlにはありません)。どのように効率的にそれを行うだろうか? 1つのオプションは、使用中にオブジェ