2016-11-15 8 views
0

私はJava8とOpenNLPを使用しています。私は文からすべての名詞の単語を抽出しようとしています。Java OpenNLP文からすべての名詞を抽出する

私はthisの例を試しましたが、すべての名詞句(NP)を抽出します。誰も私が個々の名詞の言葉をどのように抽出できるのか知っていますか?

ありがとうございました

答えて

1

これまでにお試しいただいたことはありますか?リンク先の例を詳細には見ていませんが、その例を変更してどこに行きたいか分かります。いずれの場合においても は、それは非常に難しいことではありません:http://opennlp.sourceforge.net/models-1.5/

をそして私はSimpleTokenizerは廃止されていることを言う必要があります。

InputStream modelIn = null; 
POSModel POSModel = null; 
try{ 
    File f = new File("<location to your tagger model here>"); 
    modelIn = new FileInputStream(f); 
    POSModel = new POSModel(modelIn); 
    POSTaggerME tagger = new POSTaggerME(POSModel); 
    SimpleTokenizer tokenizer= new SimpleTokenizer(); 
    String tokens[] = tokenizer.tokenize("This is a sample sentence."); 
    String[] tagged = tagger.tag(tokens); 
    for (int i = 0; i < tagged.length; i++){ 
     if (tagged[i].equalsIgnoreCase("nn")){ 
      System.out.println(tokens[i]); 
     } 
    } 

} 
catch(IOException e){ 
    throw new BadRequestException(e.getMessage()); 
} 

あなたはここで鬼のモデルをダウンロードすることができます。ちょっと洗練されたものを探したいかもしれませんが、私の経験では、OpenNLPのファンシーなものは、かなり遅くなります(通常はトークン化のためには受け入れられないほど遅くなります)。

関連する問題