でmp3ファイルURLのhref属性のための正規表現を必要とする、私はモジュール再パイソンを使用して、この正規表現を思い付いた:私はcgoldbergによって、以前のスタックオーバーフローの質問や貢献度に基づいてのpython
import re
urls = re.finditer('http://(.*?).mp3', htmlcode)
変数のURLが反復可能オブジェクトであり、私は2つ以上が存在する場合、個別に各mp3ファイルのURLにアクセスするためにループを使用することができます。
for url in urls:
mp3fileurl = url.group(0)
この技術は、しかし、時々しか動作します。私は正規表現が完全な本格的なパーサーモジュールほど信頼性が高くないことを認識しています。しかし、時々、これは同じページでは信頼できません。
一部のURLエントリでは、httpの前にすべてのものが受信されることがあります。
私は正規表現に比較的新しいです。だから、もっと信頼できる方法があるのだろうかと思っています。
ありがとうございます。 また、いくつかの回答を寄稿することを楽しみにしています。
-1:「信頼できない」のない定義を。 「時にはうまくいく」というのはあいまいです。これがうまくいかない具体例がありますか?エラーからのいくつかのエラーのトレースバック?具体的に破損しているサンプルデータこれがうまくいかない場合はできるだけ小さな例を提供してください。 –