文章あたりの単語数を数えようとするのに少し問題があります。上記の例の場合文単位で平均単語数を計算する
["Hey, "!", "How", "are", "you", "?", "I", "would", "like", "a", "sandwich", "."]
、計算は1 + 3 + 5/3
を次のようになります。私はこのようになりますリストを持っている私の場合のために、私は文章のみのいずれか"!"
、"?"
、または"."
で終わると仮定しています。私はこれを達成するのに苦労しています!何か案は?入力などの単語のリストのみが存在することができれば場合
3.0
:
import re
s = "Hey ! How are you ? I would like a sandwich ."
parts = [len(l.split()) for l in re.split(r'[?!.]', s) if l.strip()]
print(sum(parts)/len(parts))
出力:re.split()とsum()関数を使用して
秒1は本当によく働きました!私は正規表現を使用するのが好きです。私はNLPプロジェクトに取り組んでいます。 – natalien