stanford-nlp

    0

    2答えて

    私はNLPや自然言語処理はスーパーセットとテキスト分析がそれのサブセットであることを私の同僚の1を説得しようとしている今日の厳しい夜を持っていました。 恐らくおそらく両方とも同義語であり、互換性をもって使用することができます。 これは間違いありませんか?これらの用語の境界が明確に定義されているかどうか、または互換性をもって使用できるかどうかに関して、明確な透明性を持つ人は誰ですか?

    2

    2答えて

    NLTKのスタンフォードの助けを借りて名前エンティティを抽出する方法を知っています。 ただし、RegexNERも適用する必要があります。 Javaでのアプリケーションは簡単でスタンフォードはhereの例を提供しています。 しかし、NLTKでどのように使用できるかを説明する情報源は見つかりませんでした。あなたの考えや意見を分かち合うと感謝しています。

    -1

    1答えて

    CoreNLPで中国語の文章で7つのクラスNER(ウィットデート、お金...)を行うことができました。 しかし、私は中国語の文章では「スタンフォード名義エンティティ認識」という4クラスNERしかできません。 オフィシャルデモウェブサイトのケースです。 "Stanford Named Entity Recognizer"を使用して中国語の文章で7つのクラスNERを実行するにはどうすればよいですか?こ

    0

    1答えて

    私のプロジェクトにcoreNLPの依存解析を使用しています。基本的な依存関係と強化された依存関係は、特定の依存関係では異なる結果になります。 次のコードを使用して、依存関係を強化しました。次たとえば val lp = LexicalizedParser.loadModel("edu/stanford/nlp/models/lexparser/englishPCFG.ser.gz") lp.set

    2

    1答えて

    中国語と英語の両方を含むテキストをトークン化すると、英語の単語が文字に分割されます。次のコードを考えてみましょう: 出力は哈佛大学 的 M e l i s s a D e l lになります。この動作を変更するにはどうすればよいですか?

    -4

    1答えて

    「バラクオバマは米国の大統領です。彼はホワイトハウスに住んでいます。彼は週に戻って中国を訪れました。私は "彼"を "バラクオバマ"に置き換える必要があります。解決の方向性を提示してください。私はWindows 7でPython 2xを使用しています。

    1

    1答えて

    私はopennlpを使用してツイートを分類するためのモデルを訓練しようとしています。私の質問は、私は私がモデルのトレーニングや、私がサニタイズを実行せずに、直接つぶやきを使用する必要があるため使用していますつぶやきにトークン化、ストップワード除去などを行う必要があるのですか?

    1

    1答えて

    私は、そのモデルが以前に訓練された品詞タグを構成段階で使用していることを理解します。しかし、単語のほとんどが新しい場合は、パーサがその操作をどのように決定するのでしょうか?