ので、持っているソリューションへのリンクを提供どちらかである:
import urllib
import requests
import json
url = "https://daphnecaruanagalizia.com/2017/10/crook-schembri-court-today-pleading-not-crook/"
encoded = urllib.parse.quote_plus(url)
# encoded = urllib.quote_plus(url) # for python 2 replace previous line by this
j = requests.get('https://count-server.sharethis.com/v2.0/get_counts?url=%s' % encoded).text
obj = json.loads(j)
print(obj['clicks']['twitter'] + obj['shares']['twitter'])
# => 5008
説明:
ウェブページを調べると、これがリクエストされていることがわかります。
https://count-server.sharethis.com/v2.0/get_counts?url=https%3A%2F%2Fdaphnecaruanagalizia.com%2F2017%2F10%2Fcrook-schembri-court-today-pleading-not-crook%2F&cb=stButtons.processCB&wd=true
ブラウザに貼り付けるとすべての回答が得られます。 URLで少し演奏すると、余分なパラメータを削除すると素晴らしいjsonが得られることがわかります。
ご覧のとおり、リクエストのurl
パラメータを、Twitterのカウントを取得するページのURLに置き換えるだけで済みます。あなたはその後、BeautifulSoupライブラリにdriver.page_sourceを渡し、SeleniumのWebブラウザを起動した後、次のような何かができる
セレンが通常でありますこれのための最良の賭け。データを取得している特定のjavascriptリクエストを分離できない限り、 – chasmani