ファイル内の単語の数を調べる必要があります。長さ> = 1で始まり、英数字以外の非英数字が削除された英数字の任意のシーケンスが単語としてカウントされます。テキストファイルの単語数を設定する方法
num_words = 0
textfile = open('gettysburg.txt', 'r').read()
words = textfile.split()
for word in words:
if len(word) >= 1:
num_words +=1
print(num_words)
カウンタは私に268を与えるが、テキスト内の271個の言葉があります。ここでは
は、私がこれまで持っているコードです。ダッシュで区切られた4つの単語または2つの単語としてカウントされている " - "があります。これら4つの単語を表示するには、文字以外の文字を削除するにはどうすればよいですか?