-1
複数の区切り文字を使用して文字列を分割しようとしています。区切り文字を単語として保持する必要があります。 私が使用しているデリミタは、すべての句読点とスペースです。Python分割文字列と区切り文字を単語として保持
たとえば、文字列:
Je suis, FOU et toi ?!
を生成する必要があります:
class Parser :
def __init__(self) :
"""Empty constructor"""
def read(self, file_name) :
from string import punctuation
with open(file_name, 'r') as file :
for line in file :
for word in line.split() :
r = re.compile(r'[\s{}]+'.format(re.escape(punctuation)))
print(r.split(word))
しかし、私が得た結果は次のとおりです:
'Je'
'suis'
','
'FOU'
'et'
'toi'
'?'
'!'
を私が書いた
['Je']
['suis', '']
['FOU']
['et']
['toi']
['', '']
分割が正しいと思われますが、結果リストに区切り文字が含まれていません:(