1分あたり1000を超えるXHTMLドキュメントをダウンロードして実行する(つまり、JavaScriptを評価し、DOMを評価する)にはどうすればよいですか?ブラウザ環境で1000+ページ/分を実行する
いくつかのアウトライン/制約:ダウンロードする
- URLが異なるサーバ上にあります。
- 私はトラバースする必要があります。理想的には結果のDOMを変更する必要があります。
- グラフィックのレンダリングに興味がありません。
- 帯域幅は問題ではありません。
- 大規模なハードウェアの並列化が問題になります。
- 生産環境は.NETです。
私はそのページをダウンロードすることに心配していません。私は、実際にページを出すことがボトルネックだと推測します。 .NETにはWebブラウザオブジェクトが組み込まれていますが、単一のマシン上でスケールアップするかどうかはわかりません。また、.NETは絶対的な要件ではありませんが、ここでは統合が容易になります。私はに関するご意見/ポインタのために感謝されると思います
:
これを行うことが最も適しているブラウザAPI- ?
- 行くための正しい方法ブラウザです - 多分そこに最も重要な部分であるJavascriptを実行するために、より軽量な方法は、(...しかしDOMを提供していない)のか?
- オープンソースでも商業的にも、既存の製品/サービスとは何ですか?
- 私は1台のマシン(3msのChromeレンダリング商用の誰でも)で処理することができると思いますか? 1が発生する可能性がある
- どれ落とし穴...
は、事前に.NET用ヘッドレスブラウザのいずれかで
/デヴィッド・
スタート。任意のJavaScriptコードは、通常のDOM操作を行うことができると想定する可能性が非常に高くなります。 – Pointy
ああ、スループットは間違いなくこれらの「ページ」のメトリックとJavaScriptコードの性質に依存します。 – Pointy
ロードテスターのように、これは時々実行されるものなのでしょうか、それとも毎日実行されるのでしょうか? – mbeckish