2017-04-24 4 views
0

現在、私は、タグとそのタグの前の文字(空白または入力するまで)をHTMLローカルファイルに検索するプログラムを作成しようとしていますが、私はいくつかのコードを書き留めていますが、それは機能していません。PAと文字を探す代わりに、HTMLのすべてのテキストをリストするだけです。Pythonプログラムのヘルプが必要です。 HTMLからIDを検索して保存する方法

ここに私のコードは、これまでのところです:

from bs4 import BeautifulSoup 
import re 

ecj_data = open('output.html', 'r').read() 
soup = BeautifulSoup(ecj_data, 'lxml') 
d = 'PA' 
soup_strings = [ l for l in list(soup.strings) if l.strip() != '' ] 
for s in soup_strings : 
    print(s) 
+0

あなたのプログラムはどこに「PAと文字を探していますか」。 –

+0

申し訳ありませんが、私は間違ったコードファイルを貼り付けました、私の悪い – fsgdfgsd

答えて

0

あなたは 'PA' を含む単語を検索するために意味しますか?以下を試してください。

for i in soup.strings.split(' '): 
    if 'PA' in i: 
     print (i) 
+0

"ジェネレータ 'オブジェクトに属性' split 'がありません" – fsgdfgsd

+0

あなたのsoup.stringsに何が入っているのか分からないので、スープのストリング値。 – michael

+0

私はテストhtmlでこれをやっていますが、私はここに貼り付けることができます、gyazoで印刷する: https://gyazo.com/ae1e94f3b1ae990d67372d79a57987b3 – fsgdfgsd

関連する問題