Java API(スタンフォード、Apache OpenNLPで提供されているものを除く)を使用してトークナイザを構築しようとしています。 私は正規表現とJavaパターン/マッチャーを使用して単語を分離することができました。私は今、言葉の補題を見つけたいビルドJava Lemmatizer
"[a-zA-Z]+".
。 StanfordNLPのライセンス問題のためにStanfordNLPを使用したくありません。 次は? 私は、参照する/比較するモデルとして辞書が必要だと思います。 そして...? 誰もそこに行ったことがありますか? Javaを使用して単語リーマライザを構築しようとしていますか?前もって感謝します。 :)
次の理由で、httpリクエストを簡単に作成できます。 – dirai