0
htmlコードの価格を選択する際には助けが必要です。私は映画のタイトルを抽出したので、今私は価格を抽出する必要があります。私はlookaheadの正規表現を使ってみましたが、\ n。*と言ったときにエラーが出ます。"lookbehindの中の量子は固定幅になりません"。私はテキストの最初と2番目の価格が必要です。数行をスキップしてテキストを選択する正規表現
(?<=Hello<\/a>.*\n.*\n.*\n.*\n.*\n.*\n.*\n.*\n.*?(\$)
と::
正規表現私が試してみました
Hello<\/a>.*\n.*\n.*\n.*\n.*\n.*\n.*\n.*\n.*?(\$)
をしかし、動作しません。
テキスト:
<a class="blue_link" href="http://www.ebgames.com.au/Games/sjbeiub108723">Hello:</a>
<div class="hi">
<p>Including <a class="blue_link">
<p>Price$<data1>40.00</p>
Plsのヘルプとあなたに感謝:)
ですあなたの予想される出力 - $ 30.53と$ 27.46' –
HTMLを解析する場合は、HTMLパーサを使用します。 RegExはHTMLパーサーではないため、HTMLの解析には使用しないでください。 詳細については、http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tagsを参照してください。 –