1
私はhttp://corenlp.run/で遊んでいましたが、大文字と小文字が区別されています。 たとえば、「i」をFW、「I」をPRPとタグ付けします。 大文字小文字を無視するように訓練できますか?より一般的には、よく書かれていない文章のためにそれを訓練するにはどうすればよいですか?Stanford Parserは大文字小文字を無視できますか?
私はhttp://corenlp.run/で遊んでいましたが、大文字と小文字が区別されています。 たとえば、「i」をFW、「I」をPRPとタグ付けします。 大文字小文字を無視するように訓練できますか?より一般的には、よく書かれていない文章のためにそれを訓練するにはどうすればよいですか?Stanford Parserは大文字小文字を無視できますか?
CorenNLPには大文字と小文字を区別しないモデルが用意されています。彼らはそれらをcaseless modelsと呼びます。
リンクに記載されたポイントのカップルを使用している場合が警告をお読みください。これにはTrueCaseAnnotator
を使用することができます。あなたは
wordFunction = edu.stanford.nlp.process.LowercaseFunction