かなり検索して、これまでページ内の第三者のトラッキングパラメータにアクセスする方法を判断できませんでした。コードで、私は、Pythonのリクエストパッケージを経由してページのクッキーにアクセスすることができます下のが、唯一のローカルドメインのために、サードパーティのCookie /ドメインのいずれもが返されません。ページ内でサードパーティのトラッキングパラメータにアクセスするにはどうしたらいいですか?
import requests
# create session
s = requests.session()
# read data from a page
r = s.get('https://pythonprogramming.net/parsememcparseface/')
# show cookies and the domain that the cookies belongs to
print('>> printing cookies ...')
for cookie in s.cookies:
print(cookie)
print('domain=' + cookie.domain)
print(' ck_name: ' + cookie.name)
print(' ck_val: ' + cookie.value)
print(' expires: ' + str(cookie.expires))
print()
# paramaters come back empty ...
print('>> printing parameters ...')
for param in s.params:
print(param)
は、私はまたしてセレンを経由してみましたChromeのドライバ:
import time
from selenium import webdriver
driver = webdriver.Chrome(r'{path}\chromedriver\chromedriver.exe')
driver.get('https://pythonprogramming.net/parsememcparseface/')
print('Page opened ...')
# here I can access the page HTML and local session via the driver variable
driver.quit() # close page
3番目の部分のトラッキングパラメータはわかりません。すべてのヘルプは大歓迎されます
:https://pythonprogramming.net/parsememcparseface/ ChomrtのDevツールが実行され、この画像ごとにパラメータを返すGoogleアナリティクスのコレクターがあることを示すページに、明確にするために! ありがとうございます
ありがとうございます。私の知る限り、googleは_gaクッキーをテストウェブサイト([https://pythonprogramming.net/parsememcparseface/](html/pthonprogramming.net/parsememcparseface/)]にドロップするので、サードパーティのCookieそれにもかかわらず、私の問題は、私が持っているPythonコード(およびその他のオンライン検索のメソッド)が_gaクッキー情報を提供しないということです。その値を抽出する方法はありますか? – EqUiNoX
いいえ.GoogleアナリティクスのJavaScriptがページに挿入されています。したがって、それはページコードの一部となり、そのドメイン上のファーストパーティのクッキーとしてクッキーを設定します。また、クライアントID(以前のGAバージョンのデータがクライアントに保存されていましたが、非推奨になりました)以外の情報はCookieに格納されません。データを取得したい場合は、送信リクエストをgoogle-analytics.comにキャプチャする必要があります。クッキーではありません。 –
応答ありがとうございました。そして、はい、私はhttps://www.google-analytics.com/r/collect?v=1&_v=の "収集"を介してgoogle-analytics.comに送信された送信応答(パラメータ)に到達しようとしています。 j54&a = 312617887&t =ページビュー&_s = 1&... '上記のコードは、これらのHTTP応答情報にはアクセスしません。どのように私がそれに得ることができるかについてのアドバイスは非常に高く評価されます。 – EqUiNoX