文字列のリストから特定のパターンを削除するPythonの正規表現

-2

string1_YYYYMMDD_HHMMSS_string2

YYYYMMDDとHHMMSSは、実際の日付と時刻の値は以下のとおりです。ファイル名は特定のネーミング・フォーマットに従ってください。

「string1」の後ろに表示されるすべての文字を各エントリごと削除します。私は正規表現でこれを試してきましたが無駄にはありません。誰も私にこれを手伝ってもらえますか？

あなただけの最初のアンダースコアで分割正規表現、必要はありません。あなただけしようと、最後の部分（「_YYYYMMDD_HHMMSS_string2」）に頼ることができる場合

：

s = 'string1_YYYYMMDD_HHMMSS_string2' 
return s.split('_')[0]

[編集]正規表現を使用して

s = 's_t_r_i_n_g_1_YYYYMMDD_HHMMSS_string2' 
return '_'.join(s.split('_')[:-3])

2016-09-20 09:32:17 HumanCatfood

ショート＆スウィート！ –

私はそれを行うことができましたが、 'string1'にもアンダースコアを含めることができます。各文字列の最後に常に繰り返される唯一のパターンは、_YYYYMMDD_HHMMSS_string2 –

ああ、つまらないですよね。 – HumanCatfood

：

import re 
s = 'string1_YYYYMMDD_HHMMSS_string2' 
newstr = re.sub('_.*', '', s) 
print(newstr)

このようなインデックスの

注：

更新＃1

string1が追加のアンダースコアが含まれていてもよいです。私はstring1のすべてを保持し、後続のパターンを取り除きたいだけです。あなたは、次の正規表現を使用することができます。この場合

：

_\d{8}_\d{6}_.*

2016-09-20 09:42:45

string1にはさらに下線が含まれることがあります。私はstring1のすべてを保持し、後続のパターンを取り除きたいだけです。 –

@SudeepMohantyアップデートをご覧ください！ –

あなたの最新のアップデートも同様に機能します！ありがとう！ –

答えて