2017-07-10 8 views
1

私は最近、ウェブページ上の特定のリクエストが発生したかどうかをチェックするツールを書いています。たとえば、StackOverflowにアクセスしたときにロードされたGoogleサーバーのjqueryですか?ツールはwebdriverとクロムブラウザをベースにしています。私はボットだとGoogleアナリティクスに伝えるには?

このツールはチャームのように機能しますが、Googleアナリティクスのトラフィックも生成されるはずです。

Googleにツールがボットであり、カウントされてはならない可能性はありますか?私が見つけたすべての解決策は、テスト中のページと、Googleを介してデータを収集しない方法に焦点を合わせました。 Webサイトのコードを変更せずに動作するソリューションが必要です。

+0

これはgoogleの質問のように聞こえます...彼らは自分のトラフィックにボットが数えられないことをどのように知っていますか? – JeffC

答えて

1

おそらく最も簡単な方法は、カスタムのユーザーエージェント文字列を送信し、それをビューフィルタ経由でフィルタすることです。

Googleクローラーと同じユーザーエージェント文字列を使用していると、私はかなり確信しています(すべてのGoogleが自分のクローラーをフィルタリングするのに十分なほどスマートになっているはずです)。 According to this page GoogleクローラUAには常に「Googlebot」という文字列が含まれています(そうしないと、おそらくUA文字列を見つけるためにサーバーログを調べる必要があります)。ここで

0

は、あなたの質問への答えです:

それは例えばのためchecks if certain requests on a web page are firedツールを知って面白そうjquery from a google server loaded

実際には、ページなどのページが大きく異なる場合があります。 StackOverflow.comは手動で(URLを手動で入力することにより)、新しいChromeセッションを開始するためにchromedriver exeが使用されたときに開かれます。

例として、我々は新しいGoogle Chromeのセッションを開いたときに、手動で、chrome.exeと一緒に渡されるコマンドラインパラメータは、--flag-switches-beginのみ--flag-switches-endです。

chromedriver exeを使用しようとすると、Google Chromeセッションにさまざまな設定パラメータを追加するには、通常、ChromeOptionsクラスとDesiredCapabilitiesクラスのヘルプを利用します。これらのパラメータの他に、--test-type=webdriverが追加されています。

したがって、chromedriver exeがアクセスするウェブサイトは、常にAutomated Botであることを認識しています。

これがあなたの質問に答えるかどうか教えてください。

1

クロムエクステンションで問題を解決しました。その拡張機能は、googleのエンドポイントに対するすべてのリクエストをexample.comにリダイレクトします。魅力のように動作します。

関連する問題