2017-01-01 9 views
-1

私はpython 3.6とpycharm 2016.2を使用しており、Webサイトをクロールしようとしています。私はいくつかの韓国語の手紙をenconding問題があるかもしれません。

「保険事故情報:内車傷害」(第5表を含む)のカテゴリでは、「pタグ」の1つが内容に「偶然」あるとデータをクロールしようとしました。

以下は私のコードです。それは何も戻ってこない。

助けてください。

from bs4 import BeautifulSoup 
import urllib.request 
from urllib.parse import urlparse 
import re 

popup_insurance = "http://www.bobaedream.co.kr/mycar/popup/mycarChart_B.php?car_number=35%EB%91%908475&tbl=cyber&cno=651451" 
res = urllib.request.urlopen(popup_insurance) 
html = res.read() 
soup_insurance = BeautifulSoup(html, 'html.parser') 
insurance_content_table = soup_insurance.find_all('table') 

elem = soup_insurance.find("p", text="보험사고이력 정보 : 내차 피해") 
while elem.string != "보험사고이력 정보 : 타차 가해": 
    if "사고일자" in elem.next_sibling: 
     print(elem.next_sibling) 

    elem = elem.next_sibling 

    if elem is None: 
     break 

答えて

0

あなたはelem.next_siblingNavigableString年代を通じてループは時々奇妙なことができるはずです。

from bs4 import BeautifulSoup 
import urllib.request 
from urllib.parse import urlparse 
import re 

popup_insurance = "http://www.bobaedream.co.kr/mycar/popup/mycarChart_B.php?car_number=35%EB%91%908475&tbl=cyber&cno=651451" 
res = urllib.request.urlopen(popup_insurance) 
html = res.read() 
soup_insurance = BeautifulSoup(html, 'html.parser') 
insurance_content_table = soup_insurance.find_all('table') 

elem = soup_insurance.find("p", text="보험사고이력 정보 : 내차 피해") 
while elem.string != "보험사고이력 정보 : 타차 가해": 
    for string in elem.next_sibling: 
     if "사고일자" in string: 
      print(elem.next_sibling.string.strip()) 

    elem = elem.next_sibling 

    if elem is None: 
     break 

私はあなたが事故の日/修理コストのビットを望んでいたことを(あなたが期待される出力を提供しなかったため)と仮定しています。

これは完璧なものでもエレガントなものでもありません。これはforループだけで実現できます。

関連する問題