2017-01-30 20 views
0

私は、プログラムでどのようなアクションが取られるかによって動的に埋められる.htmlファイルを持っていますが、正確な文字列を検索するときに問題があります。ファイルが空でないことを知っていれば、ループは何も返さず、空白と考えるでしょう。Pythonは.htmlファイルの正確な文字列を見つける

'blah' in line,re.findallwith open()などの空白を返すたびに、他の多くの質問を検索して読みましたが、HTML解析などが必要なのですか? 誰も私のためにこれにどのような光を当てることができますか?

f = open(outApp + '_report.html', 'r+') 
for line in f: 
    #check the for loop works 
    self.progressBox.AppendText(line) 
    if 'mystring' in line: 
     #do stuff 

私が見つけたい文字列がそれは間違いなく特別なHTMLパーサなしに行われるべきではありませんされて

+1

'r +'、なぜあなたは 'r +'と書いていますか? –

+0

'mystring'が見つからない場合はファイルに書きたいので、 –

+0

afaikそれは 'r + w'かそうでなければなりません。 –

答えて

0

H2タグでラップされMy countryです。

Googleは、あなたが望む任意のpython HTMLパーサーについて語っています。基本的な使い方は簡単です。たとえば、lxmlです。擬似コードでは、あなたの仕事は次のようになります。

from some_cool_lib import SomeCoolHTMLParser 
parser = SomeCoolHTMLParser() 
doc = parser.parse(path_to_my_html_file) 
h2_elements = doc.findall('h2') 
for h2 in h2_elements: 
    if h2.text == 'My country': 
     # do stuff 
関連する問題