私は「アメリカ」と言いましょう。私は文書全体が「アメリカ」かどうかを知りたいのですか? 「USA」という言葉は、文書内で100回または1000回のように言えるかもしれませんが、その日の終わりまでに文書は中国について話しているかもしれません。Pythonはテキスト関係のライブラリを提供していますか?
私はPythonでセンチメント分析ライブラリを使いましたが、ドキュメントがその単語を肯定的、否定的、または中立的な方法で記述した場合にのみ、これらのライブラリが返されます。
単語の言葉の数、単語とその単語の単語の類似度はカウントできますが、全体としての単語が上記の単語かどうかを判断する方法はまだ分かりません。
これを行うためのPythonにはライブラリがありますか、またはAPIはありますか?
チェックトピックモデリング:https://textacy.readthedocs.io/en/latest/ – MedAli
@MedAliをありがとう、私がかかりますそれを見てください。 – codeDojo
このリンクに記載されているコードは便利だと思います。このコードを使用して、単語頻度が最も高い1つの文章内のテキストをサマライズします。 https://github.com/assafelovic/nlp_url_summarizer –