Pythonプログラムのヘルプが必要です。 HTMLからIDを検索して保存する方法

現在、私は、タグとそのタグの前の文字（空白または入力するまで）をHTMLローカルファイルに検索するプログラムを作成しようとしていますが、私はいくつかのコードを書き留めていますが、それは機能していません。PAと文字を探す代わりに、HTMLのすべてのテキストをリストするだけです。Pythonプログラムのヘルプが必要です。 HTMLからIDを検索して保存する方法

ここに私のコードは、これまでのところです：

from bs4 import BeautifulSoup 
import re 

ecj_data = open('output.html', 'r').read() 
soup = BeautifulSoup(ecj_data, 'lxml') 
d = 'PA' 
soup_strings = [ l for l in list(soup.strings) if l.strip() != '' ] 
for s in soup_strings : 
    print(s)

出典

2017-04-24 fsgdfgsd

あなたのプログラムはどこに「PAと文字を探していますか」。 –

申し訳ありませんが、私は間違ったコードファイルを貼り付けました、私の悪い – fsgdfgsd

あなたは 'PA' を含む単語を検索するために意味しますか？以下を試してください。

for i in soup.strings.split(' '): 
    if 'PA' in i: 
     print (i)

出典

2017-04-24 11:55:09 michael

"ジェネレータ 'オブジェクトに属性' split 'がありません" – fsgdfgsd

あなたのsoup.stringsに何が入っているのか分からないので、スープのストリング値。 – michael

私はテストhtmlでこれをやっていますが、私はここに貼り付けることができます、gyazoで印刷する： https://gyazo.com/ae1e94f3b1ae990d67372d79a57987b3 – fsgdfgsd

Pythonプログラムのヘルプが必要です。 HTMLからIDを検索して保存する方法

答えて

関連する問題