ニューヨークタイムズのサイトから記事を拝借し、空の結果セットを得る。私の目的は、h3アイテムのURLとテキストを取得することです。私がこれを実行すると、私は空のセットを取得します。 HTMLは、実際にデータが含まれていないhttp://query.nytimes.com/search/sitesearch/?action=click&contentCollection®ion=TopBar&WT.nav=searchWidget&module=SearchSubmit&pgtype=sectionfront#/san+diego/24hours空の結果セット美しいスープ
url = "http://query.nytimes.com/search/sitesearch/?action=click&contentCollection®ion=TopBar&WT.nav=searchWidget&module=SearchSubmit&pgtype=sectionfront{data}"
html = urlopen(url.format(data="#"+'/san+diego/24hours'))
soup = BeautifulSoup(html.read().decode('utf-8'),"lxml")
section = soup.find("ol",class_='searchResultsList flush')
items = section.find_all('li', class_="story")
print items
よろしくお願いいたします。第二に、これまでに経験したことはありません。それはBS4を使用して言及された値のためにそれを解析することは可能ですか? –
標準ライブラリにある 'json'モジュールを使って解析します。 BS4を使うよりはるかに良い素敵なPython辞書を手に入れることができます。 –
ありがとう、私はそれについてツタンカーメンを探します。 –