SeleniumのChromeDriverとCrawljaxを使用して、URLジェネレータから受信した一連のランダムなWebサイトをクロールして、取得したDOM状態の静的コード分析を実行したいとします。自動WebクローリングにSelenium WebDriverを使用すると危険ですか?
クロールを行っているマシンでは、これは危険なことはありますか?
ランダムに生成されたサイトの1つが悪質で、ChromeDriver(新しいDOM状態を取得するために使用される)からJavaScriptを実行すると、テストを実行しているマシンが何らかの形で感染することが懸念されます。私はある種のサンドボックス環境でこれを実行するべきですか?
--edit--
それが問題にした場合、クローラは完全にJavaで実装されています。
アンブレイカブルであるとは考えていないChromeはサンドボックス環境内のすべてを実行します。 Chromeのアドオンをインストールしていない場合は、大きな問題ではありません。 しかし、多くのサイトではトラッカーを使用しており、トラッカーは閲覧している共通サイトを追跡できます。したがって、すべてのドメインに対して個別のプロファイルを作成することもできます。しかし、あなたはクロールしているだけでプライベートなクッキーを保存していないので、別のドメインに同じインスタンスを再利用することも問題ではありません。 –
@ TarunLalwaniありがとうございました。 –