私の入力があります
<span question_number="18"> blah blah blah 1</span>
<span question_number="19"> blah blah blah 2</span>
通知をカバーできる素朴な解決策:それらが異なるLIN上にあります18
、blah blah blah 1
と19
、blah blah blah 2
より良い正規表現解決策を探して
が、入力が同じ行にある<span question_number="18"> blah blah blah 1</span><span question_number="19"> blah blah blah 2</span>
あるとき私の出力が18
ある
、blah blah blah 1</span><span question_number="19"> blah blah blah 2
どのように私ができた:ES
出力されますこの問題を回避しますか?
更新: 正規表現:/\<span question_number=(?:\")*(\d*)(?:\")*>(.*)<\/span>/ig
testinput:
CASE1 - > 2行のコード
<span question_number="54">often graces doorways tied into ropes called</span>
<span question_number="54">often graces doorways tied into ropes called <i>ristras</i>.</span>
ケース2 - >コード
<span question_number="54">often graces doorways tied into ropes called</span><span question_number="54">often graces doorways tied into ropes called <i>ristras</i>.</span>
の一行アップデート2:
これはdomではありません。単に私が処理したいプレーンテキストです。
Update3: 正規表現についての私の問題は解決されました。正規表現とドミノ演算の間の処理速度の比較に関する質問がありますか?どのようにそのようなテストを実装することができますか?
なぜHTMLと正規表現を一致させるのですか? http://stackoverflow.com/questions/590747/using-regular-expressions-to-parse-html-why-not – epascarello
私はあなたにhttp://stackoverflow.com/questions/1732348/regex-match-openを読むよう促します。タグが付きません - xhtml-self-contained-tags/1732454#1732454あまりにも遅くなります –
これを編集してもらえますか? – evolutionxbox