2016-12-21 3 views
0

私はPythonでいくつかの正規表現を実行して、さまざまなパターンのテキストを別のファイルにドロップしようとしています。Regexが正確にX行を見つける

12340987 some other text 
      some text 
      some text 

しかし、パターンは、このような4本のラインを、持っていることを、私は持っている小さな可能性:私のソースファイルからすべての行の99 +%はこのような3ラインの形式を持っている、判明

123456789 Some text 
      Some text 
      some text 
      one extra line of text 

私はすべての4ラインパターンを追いかけるために正規表現を書き込もうとしており、こので始まった:

^[0-9]+([\s\S]*?)(?=^[0-9]) 

どのように私はこのような主旨で何かを構築することができますが、唯一のグラブ4行のパターン?読んでいただきありがとうございましたら、お手伝いをしてください。 :)

+0

数字で始まる行が1つあり、その後に空白で始まる3行があることを考慮してください。空白文字の開始行のパターンを3回複製するか、 '{3}'で修飾することができます。 [the docs](https://docs.python.org/2/library/re.html#regular-expression-syntax)を読んでください。また、 're.MULTILINE'オプションを忘れないでください。 – 9000

+0

これは欲しいですか? https://regex101.com/r/5ZGXPs/2 –

答えて

0

あなたはこのような何かを試みることができる:ラインの ^[0-9]+.+$\s =スタート、数、次に何かによって、以下:

を設定gm

^[0-9]+.+$\s(?:^(?!\d).+$\s?){3} 

フラグがhttps://regex101.com/r/TOoCzF/1

説明はこちらをご覧ください行末と改行

次に (?:^(?!\d).+$\s?){3} =数字で始まらない行の3倍

+0

偉大な答え、リソースと説明!お手伝いありがとう! – phfb

関連する問題