私は、このリンクでウェブサイトをこすりしようとしていますのpython

でサッカーサイトからJSONデータを取得：、私は概要からデータを取得したい私は、このリンクでウェブサイトをこすりしようとしていますのpython

https://www.whoscored.com/Players/11119/Show/Lionel-Messi

守備、攻撃タブと私はこれを試してみました：

import requests 
# This is the json data link i wish to get from the defensive tab (from developer tools) 
url = "https://www.whoscored.com/StatisticsFeed/1/GetPlayerStatistics?category=summary&subcategory=defensive&statsAccumulationType=0&isCurrent=true&playerId=11119&teamIds=&matchId=&stageId=&tournamentOptions=&sortBy=Rating&sortAscending=&age=&ageComparisonType=&appearances=&appearancesComparisonType=&field=Overall&nationality=&positionOptions=&timeOfTheGameEnd=&timeOfTheGameStart=&isMinApp=false&page=&includeZeroValues=true&numberOfPlayersToPick=" 

response = requests.get(url) 

print(response.json())

私はJSONデータを印刷し、私はタブから必要なデータをこすりするために管理することはできません

、私は何も悪いことをやっていますか？助けてくれてありがとう。

出典

2017-08-30 david plotkin

少なくとも、この質問で書かれたURLは無効です。 – n1c9

レスポンスはJSONではなくHTMLであるため、動作しません。 – Kamran

提供されているようにコードを実行すると、応答は403 "禁止された"状態に戻ります。

おそらく、このプロバイダはデータをスクラップしないようにし、ブラウザ以外のアクセスの兆候がないかどうかを確認し、このエラーを返します。

進む前に必ずresponse.status_codeを確認してください。

出典

2017-08-30 19:53:33

ステータスは本当に403ですが、とにかくデータをスクラップできますか？ –

user-agentのような基本的なものを使ってヘッダを追加しようとしましたか？ – jlaur

おそらくrequests.Session（）を使ったクッキーの処理... – jlaur

私は、このリンクでウェブサイトをこすりしようとしていますのpython

答えて

関連する問題