私はデータ
Data['SUMMARY']=Data['SUMMARY'].str.replace(r'([^\w])',' ')
Data['SUMMARY']=Data['SUMMARY'].str.replace(r'x{2,}',' ')
Data['SUMMARY']=Data['SUMMARY'].str.replace(r'_+',' ')
Data['SUMMARY']=Data['SUMMARY'].str.replace(r'\d+',' ')
Data['SUMMARY']=Data['SUMMARY'].str.replace(r'\s{2,}',' ')
は私がすべての句読点を交換したい、このようないくつかの正規表現を持って、XXXXXXXX、すべての桁、空の文字列''
にすべての非英数字。どのようにして1つの正規表現に置き換えることができますか?
'データ[ '概要'] str.replace( '[^-ZA-Z \ S] + | X。 {2、} '、' ') '? –
スペースも削除する必要がありますか? – Allan