マークアップで特定の文字列を抽出して保存しようとしています(この行の複雑な処理のため)。Pythonで特定の文字列を抽出する方法
<center><img border="0" src="http://www.world-of-waterfalls.com/images/Cascades_04_015L.jpg" WIDTH="500" HEIGHT="375" alt="Looking up the Merced River Canyon towards Bridalveil Fall from the Big Oak Flat Road" ***PINIT***></center><br clear="all"><br clear="all">
しかし、私が保存したい:
tempUrl = 'http://www.world-of-waterfalls.com/images/Cascades_04_015L.jpg'
tempWidth = 500
tempHeight = 375
tempAlt = 'Looking up the Merced River Canyon towards Bridalveil Fall from the Big Oak Flat Road'
は、どのように私はPythonでそれをやって行くだろうので、たとえば、私は、ファイルからの行に読んだし、現在の行があると言います?
おかげ
私はあなたに問題を保存して、正規表現がこれに該当しないことを教えてください。それを試して考えてはいけません。後で頭を打つだけです。データがWebソースからのものであれば、BeautifulSoupまたはscrapyまたはその他の「スクレイピング」ライブラリを参照してください。マークアップをすでにお持ちの場合は、パーサを使用してノードをたどり、属性情報を収集するだけです。 –
['HTMLParser'](https://docs.python.org/2/library/htmlparser.html)または[' html.parser'](https://docs.python.org/3.4/library/html)です。 parser.html)は、Pythonバージョン –