私はすでに投稿したものと同じHTMLに戻ります。私が他の方法があることを知っていても、少しRegExを学ぶことを試みている。で何かを一致させるにはPython Regex - IronPythonではなくExpressoで動作します
publisher.php\?c=.*?\">(.*?)</a>(?:.*?)<br\s\\>(?:[\s\r\n]*?)Date:\s<time\sdatetime="(.*?)\">(?:.*?)(?:[\s\r\n]*?)Pages:\s*?(\d*?)<br\s\\>
:私は
私の表現がある...ちょうど挑戦のように、ダムないんだけど、私はエスプレッソでそれをテストする場合
<p>Country: <a href="country.php?c=it">Italy</a><br \>
Publication: <a href="publication.php?c=it/TL">Topolino (libretto)</a></p>
Publisher: <a href="publisher.php?c=Mondadori">Mondadori</a><br><br \>
Date: <time datetime="1970-11-22">November 22, 1970</time><br \>
Pages: 196<br \>
Price: 150 Lit. <br \>
<span class="indexedBy">Index delivered by: <a href="mag-inx.php?c=ABo">ABo</a></span>
正常に動作しますが、私がPythonで動かすと、私の結果はすぐにグループ1になりません...
手がかりはありますか?
おかげで、
M
なぜ正規表現でHTMLを処理していますか? – Tomalak
学習しますか?私の心の中でPythonとRegExの両方を手に入れる最良の方法は?誰もがそれをしないと言いますから? :-) – Maurizio
私は自分の答えを更新しました。 –