URLを指定してページを取得するのは簡単ですが、単純なHTMLは取得できませんが、javascriptを実行した後にHTMLを取得します。レンダリングされたHTMLのみを出力するjavascriptレンダリングをサポートするコマンドラインブラウザ
私はCutyCaptを認識していますが、私にとっては、一部のWebページでは10秒以上かかることは遅いです。また、空の/非最終HTMLを返すことができるので、--min-waitオプションを使用するのは快適ではありません。また、それは時々異なるHTMLを与えるようです。ときには、javascript関数で作成された要素をレンダリングすることもありますが、そうでない場合もあります。
代替手段はありますか?私はURLを与え、レンダリングされたhtmlを元に戻したい。
なぜこれが短時間で可能だと思いますか? 10秒かかるようですが、数ミリ秒でこれを実現することはできません。ブラウザとJavaScriptの実装は複雑です。 – jwueller
クロムのようなブラウザは5秒以内に実行できます。問題に引用された問題: "また、それは異なるHTMLを与えるようだ時々から。時にはjavascript関数で作成された要素をレンダリングすることもありますが、そうでない場合もあります。 " –
Webkitを使用して独自のWebKitを構築することができます。 – jwueller