2017-08-30 14 views
0

でサッカーサイトからJSONデータを取得:、私は概要からデータを取得したい私は、このリンクでウェブサイトをこすりしようとしていますのpython

https://www.whoscored.com/Players/11119/Show/Lionel-Messi

守備、攻撃タブと私は これを試してみました:

import requests 
# This is the json data link i wish to get from the defensive tab (from developer tools) 
url = "https://www.whoscored.com/StatisticsFeed/1/GetPlayerStatistics?category=summary&subcategory=defensive&statsAccumulationType=0&isCurrent=true&playerId=11119&teamIds=&matchId=&stageId=&tournamentOptions=&sortBy=Rating&sortAscending=&age=&ageComparisonType=&appearances=&appearancesComparisonType=&field=Overall&nationality=&positionOptions=&timeOfTheGameEnd=&timeOfTheGameStart=&isMinApp=false&page=&includeZeroValues=true&numberOfPlayersToPick=" 

response = requests.get(url) 

print(response.json()) 
私はJSONデータを印刷し、私はタブから必要なデータをこすりするために管理することはできません

、私は何も悪いことをやっていますか? 助けてくれてありがとう。

+0

少なくとも、この質問で書かれたURLは無効です。 – n1c9

+0

レスポンスはJSONではなくHTMLであるため、動作しません。 – Kamran

答えて

0

提供されているようにコードを実行すると、応答は403 "禁止された"状態に戻ります。

おそらく、このプロバイダはデータをスクラップしないようにし、ブラウザ以外のアクセスの兆候がないかどうかを確認し、このエラーを返します。

進む前に必ずresponse.status_codeを確認してください。

+0

ステータスは本当に403ですが、とにかくデータをスクラップできますか? –

+0

user-agentのような基本的なものを使ってヘッダを追加しようとしましたか? – jlaur

+0

おそらくrequests.Session()を使ったクッキーの処理... – jlaur

関連する問題