1
私は文章を含むリストを持っています。Spacyを使ってLemmatizing
list = ["I'm hoping to go jogging", "I haven't eaten in a while","where is everybody going"]
私は、上記のリストをlemmatizeと補題の持つ本来の言葉を交換したいです。
spacyを使用してどうすればよいですか?
私は補題をループで印刷することができますが、私が望むのは原語をlemmatizedに置き換えることです。
のような文章がある場合、これは、除いて大丈夫に見えます。カンマとフルストップは別の言葉になります。私はどうやってそれを得るのですか?私はそれを見せたいと思っています - 「こんにちは、どうやっていますか?いいですか?」 – Nimphadora
@AshanWijenayake最初にトークン化し、次にlemmatizeし、lemmatizedトークンに参加しますか?上記のコードから 'tok.is_punct'を根本的に削除してください。 – erip
私は 'tok.is_punct'を入れました。なぜなら、結果に疑問符やその他の句読点が必要ないからです – cardamom