私はウェブスクレイピングには非常に新しいので、nba.comからいくつかのNBAプレーヤーのデータを掻き集めることにいくつか問題があります。私は最初にbs4を使ってページを掻き集めようとしましたが、いくつかの研究の後で私が読んだ記事の「XHR」に起因すると考えられる問題に遭遇しました。 json形式のデータにWebアドレスを見つけることができましたが、私のpythonプログラムは動作しなくなり、データをロードしませんでした。繰り返しますが、私はウェブスクレイピングで非常に新しいですが、私がここで道を離れるかどうかを知ると思っていました...どんな提案?ありがとう! (下記コード)jsonのウェブページを掻き集める
import requests
import json
url = "http://stats.nba.com/stats/leaguedashplayerstats?College=&Conference=&Country=&DateFrom=&DateTo=&Division=&DraftPick=&DraftYear=&GameScope=&GameSegment=&Height=&LastNGames=0&LeagueID=00&Location=&MeasureType=Base&Month=0&OpponentTeamID=0&Outcome=&PORound=0&PaceAdjust=N&PerMode=PerGame&Period=0&PlayerExperience=&PlayerPosition=&PlusMinus=N&Rank=N&Season=2017-18&SeasonSegment=&SeasonType=Regular+Season&ShotClockRange=&StarterBench=&TeamID=0&VsConference=&VsDivision=&Weight="
resp = requests.get(url=url)
data = json.loads(resp.text)
print(data)
なぜライブラリを見ていないのですか? https://github.com/seemethere/nba_pyか、少なくとも彼らがそれをやったかを見てください。 – corn3lius
まだ見つかりませんでした..ありがとうございます! – johankent30