正規表現を使用して分割したい文字列があります。正規表現で分割する
入力:
S1:1- first split begins.s2:1- first split ends.s1:2-second split begins.S2:2-second split ends,S1:3-third split begins.S2:3-third split ends.
出力:我々は
を分割した表現を含むリストであるべきであるS1 [1-最初の分割が開始されると、S2:1-最初の分割は、S1を終了:2私はこれは私が持っているものですが、それは私の与えたパターン[s/S][1/2]:[0-9][0-9]
に分割したい3 - 第三分割始まり.....]
:2秒の分割が終了し、S1は: - セカンドスプリットは、S2を開始します私は分割した正規表現を削除します。
import re
text="""S1:1- first Split begins.continue the sentence
s2:1- first split ends
s1:2-second split begins
S2:2-second split ends
S1:3-third split begins
S2:3-third split ends """
output=re.split("[Ss][12]:[0-9]*", text)
あなたが出力として望むものを追加してくださいすることができます。 –
これを単に '\ n'で分割することを考えてください。' re.split( "\ n"、text) ' – Ibrahim
のように\ nを持つ必要はありません。テキストは1つの大きな文字列にすることができます。 – AMisra