2010-11-27 13 views
2

URLを指定してページを取得するのは簡単ですが、単純なHTMLは取得できませんが、javascriptを実行した後にHTMLを取得します。レンダリングされたHTMLのみを出力するjavascriptレンダリングをサポートするコマンドラインブラウザ

私はCutyCaptを認識していますが、私にとっては、一部のWebページでは10秒以上かかることは遅いです。また、空の/非最終HTMLを返すことができるので、--min-waitオプションを使用するのは快適ではありません。また、それは時々異なるHTMLを与えるようです。ときには、javascript関数で作成された要素をレンダリングすることもありますが、そうでない場合もあります。

代替手段はありますか?私はURLを与え、レンダリングされたhtmlを元に戻したい。

+0

なぜこれが短時間で可能だと思いますか? 10秒かかるようですが、数ミリ秒でこれを実現することはできません。ブラウザとJavaScriptの実装は複雑です。 – jwueller

+0

クロムのようなブラウザは5秒以内に実行できます。問題に引用された問題: "また、それは異なるHTMLを与えるようだ時々から。時にはjavascript関数で作成された要素をレンダリングすることもありますが、そうでない場合もあります。 " –

+0

Webkitを使用して独自のWebKitを構築することができます。 – jwueller

答えて

1

現在のバージョンのCutyCaptureをsvnリポジトリから取得し、Qt 4.7.1(またはQt git repositoryのトランクバージョン)でコンパイルすることができます。現在のWebkitの実装は、コンパイル時に使用されるバージョン4.4.0よりも高速ですCutyCaptureのバージョンですが、まだ高速ではない場合は、コードをプロファイリングして最適化できるかどうかを調べることができます。