html行のタイトルを抽出する質問があります。 私のHTML行のタイトルの抽出
はどうすれば自動的に抽出しようとして行くだろう..私は、ハイパーリンクとして表示されないためにラインのためにいくつかの余分なスペースを追加する必要がありました、笑<span class="title_name"> <a href="/?id=2124">Fairwood</a></span>
と:
のは、私のラインがあるとしましょう"フェアウッド"は、異なるIDとタイトルで、同様にフォーマットされたいくつかの行を与えられます。事前に
おかげで
なぜdownvotes?小さなコメントがもっと役立つかもしれません。 –
文字列 'href'を検索し、'> 'に遭遇した直後にキャプチャを開始し、' <' – Haris
が見つかるまであなたはこのSOの投稿を見てください:https://stackoverflow.com/questions/11709079/parsing-html-using-pythonとHTMLを解析するためにregexを使用したことがないようにしてください。 https://stackoverflow.com/a/1732454/190823 – Jens