におけるPostgreSQLの正規表現の先読み/後読み<code>regexp_matches</code>を使用してposgres
中のような内容でテキストフィールドを持っている:[A1、A2、A3、のリストを取得しようとすると
unique_string_abc
<ul>
<li>a1</li>
<li>a2</li>
...
<li>an</li>
</ul>
blah
blah
<ul>
<li>b1</li>
...
<li>bn</li>
</ul>
blah
blah
<ul>
<li>c1</li>
...
<li>cn</li>
<ul>
blah
...、 ]しかし
c1..cn、b1..bnを除外するこれまでのところ、私が使用して、それを分割<ul>...</ul>
と後での間に完全な文字列を返す最初のもので、複数のサブクエリを使用してそれを取得することができました:
SELECT regexp_matches(html_text,
'unique_string_abc\s*?<ul>\s*?(<li>.*?<\/li>)\s*?</ul>',
'g')
しかし、</ul>
のルックアヘッドまたはlookbehindを使用して単一の正規表現を使用すると簡単な方法が必要だと思っていますか?
どのポインタも大変ありがとうございます。
ありがとう!それは私がやっていることのようなものです。それを一歩に合理化するためのクールで簡単な正規表現がほしいと思っていました – user3397554