2017-05-07 15 views
1

かなり検索して、これまでページ内の第三者のトラッキングパラメータにアクセスする方法を判断できませんでした。コードで、私は、Pythonのリクエストパッケージを経由してページのクッキーにアクセスすることができます下のが、唯一のローカルドメインのために、サードパーティのCookie /ドメインのいずれもが返されません。ページ内でサードパーティのトラッキングパラメータにアクセスするにはどうしたらいいですか?

import requests 
# create session 
s = requests.session() 
# read data from a page 
r = s.get('https://pythonprogramming.net/parsememcparseface/') 
# show cookies and the domain that the cookies belongs to 
print('>> printing cookies ...') 
for cookie in s.cookies: 
    print(cookie) 
    print('domain=' + cookie.domain) 
    print(' ck_name: ' + cookie.name) 
    print(' ck_val: ' + cookie.value) 
    print(' expires: ' + str(cookie.expires)) 
print()  
# paramaters come back empty ... 
print('>> printing parameters ...') 
for param in s.params: 
    print(param) 

は、私はまたしてセレンを経由してみましたChromeのドライバ:

import time 
from selenium import webdriver 
driver = webdriver.Chrome(r'{path}\chromedriver\chromedriver.exe') 
driver.get('https://pythonprogramming.net/parsememcparseface/') 
print('Page opened ...') 
# here I can access the page HTML and local session via the driver variable 
driver.quit() # close page 

3番目の部分のトラッキングパラメータはわかりません。すべてのヘルプは大歓迎されます

GA collection parameter

https://pythonprogramming.net/parsememcparseface/ ChomrtのDevツールが実行され、この画像ごとにパラメータを返すGoogleアナリティクスのコレクターがあることを示すページに、明確にするために! ありがとうございます

答えて

0

クッキーは設定されたドメインからのみ読み取ることができます。これはクッキーが動作する方法です。

Googleアナリティクスでは、サードパーティのCookieのデータは使用されません。それが機能するために必要な唯一のクッキーは、clientIdを持つ_gaクッキーであり、それは注入されたjavascriptによって設定されたファーストパーティのクッキーです。

+0

ありがとうございます。私の知る限り、googleは_gaクッキーをテストウェブサイト([https://pythonprogramming.net/parsememcparseface/](html/pthonprogramming.net/parsememcparseface/)]にドロップするので、サードパーティのCookieそれにもかかわらず、私の問題は、私が持っているPythonコード(およびその他のオンライン検索のメソッド)が_gaクッキー情報を提供しないということです。その値を抽出する方法はありますか? – EqUiNoX

+0

いいえ.GoogleアナリティクスのJavaScriptがページに挿入されています。したがって、それはページコードの一部となり、そのドメイン上のファーストパーティのクッキーとしてクッキーを設定します。また、クライアントID(以前のGAバージョンのデータがクライアントに保存されていましたが、非推奨になりました)以外の情報はCookieに格納されません。データを取得したい場合は、送信リクエストをgoogle-analytics.comにキャプチャする必要があります。クッキーではありません。 –

+0

応答ありがとうございました。そして、はい、私はhttps://www.google-analytics.com/r/collect?v=1&_v=の "収集"を介してgoogle-analytics.comに送信された送信応答(パラメータ)に到達しようとしています。 j54&a = 312617887&t =ページビュー&_s = 1&... '上記のコードは、これらのHTTP応答情報にはアクセスしません。どのように私がそれに得ることができるかについてのアドバイスは非常に高く評価されます。 – EqUiNoX

関連する問題