アルファベットの内容を含む単語のみをファイルから読み込み、リストに挿入しようとしています。ファイルの読み込みで特殊文字を無視する
def readWords(x,y):
with open(x,'r') as f:
for line in f:
for word in line.split():
y.append(word)
firstFile = sys.argv[1]
firstList = []
readWords(firstFile, firstList)
サンプルファイル:
car */ /*one lemon grass
food accelerate
どのように特殊文字(のみアルファベットコンテンツ、句読点記号、または数字)除くすべての単語を読み込むために、これを修正するのですか?つまり最終結果ビーイング:
[car, one, lemon, grass, food, accelerate]
正規表現は、ここでは最高だろう。 '\ s'条件を使用して特殊文字を取得することができます – Adib
@Adib '\ s'は空白を取り込みます。 –
@Scherfあなたに特別な文字はどれですか? –