私はウェブスクレイピングにはまったく新しいです。私はhereのデータを削りたいと思っています。主に、その国の年、国、GDPのデータがあります。Pythonを使用してこのサイトからすべてのデータを削る方法
私のコードは以下の通りです:
from urllib.request import urlopen
from bs4 import BeautifulSoup
data = "http://databank.worldbank.org/data/reports.aspx?source=2&series=NY.GDP.MKTP.CD&country=#"
page = urlopen(data)
soup = BeautifulSoup(page,'html.parser')
name_box = soup.find('div',attrs = {'class':'canvas'})
name = name_box.text.strip()
print(name)
私はしかし、それだけで、それらのトップ10+であるデータを得ることができます。
私の質問は、データがページ自体にない場合(つまり、他の場所からインポートされた場合など)、これらの問題に対してどうすればよいのでしょうか。 入力いただきありがとうございます。
javascriptのレンダリングを検索し、クローム開発ツールでリクエストを確認するか、またはセレンを使用してください – eLRuLL
(1)開いているURLに空白があります。 (2)どのデータを受け取ろうとしていますか? –
これを指摘してくれてありがとう、これはサイトです:http://databank.worldbank.org/data/reports.aspx?source=2&series=NY.GDP.MKTP.CD&country=#それ以外の場合は、質問。 – learnandshare