私は、次の入力のみ次のdivは(div要素を含まない)まで、正規表現がコンテンツを取得する
<div style="s1">title1</div>
<div style="s1">content1</div>
<div style="s1">title2</div>
<div style="s1">content2</div>
を持っている私のようなものが必要になり、私はtitle1
とtitle2
を知っていると私はcontent1とcontent2
を収集したいですこの:
<div style="s1">title1</div>.*?<div style="s1">(.*?)</div>
が、正規表現は貪欲であるため、それは
を返すので、それは最後まで一致しましたcontent1</div>
<div style="s1">title2</div>
<div style="s1">content2
パターンにマッチに含めないタグのリストを追加したいと思います。以下のような
何か:私は含まれていないものを[^<div]
で参照する
<div style="s1">title1</div>.*?<div style="s1">(.*?[^<div])</div>
。これは複数のオプションにする必要があります。おそらく|
どうすればいいですか?
+1真実のストーリー...正規表現は人々に魔法のような暖かなファジー感情を与えますが、DOMの解析にはひどいです。 –