可能性の重複:
How do I grab a thumbnail screenshot of many websites?Mechanizeの印刷
私は、ページにログインし、取得するためにperlのMechanizeのを使用してスクリプトを書きました。私のperlスクリプトから直接 "pdf"にそのページを "印刷"することはできますか?私はそれがブラウザでどのように見えるのスナップショットを保存したいと思います。
私は$mech->content();
可能性の重複:
How do I grab a thumbnail screenshot of many websites?Mechanizeの印刷
私は、ページにログインし、取得するためにperlのMechanizeのを使用してスクリプトを書きました。私のperlスクリプトから直接 "pdf"にそのページを "印刷"することはできますか?私はそれがブラウザでどのように見えるのスナップショットを保存したいと思います。
私は$mech->content();
チェックアウトwkhtmltopdf - PDFと画像(PNGなど)のバリエーションがあります。これは、基本的にWebkitのhtmlエンジンをラップするコマンドラインツールです。非常にうまく動作し、それもクロスプラットフォームです。あなたのログインフォームを超えることができるかどうかは、ターゲットサイトの仕組みによって異なります。
あなたはそれを印刷することはできませんので$mech
は、プレーンなHTMLが含まれているを使用してHTMLを取得することができます。このスレッドをチェック:How do I grab a thumbnail screenshot of many websites?
これはPDFではなくPNGを出力します。 – daxim
CPAN modules to convert HTML to PDFの番号があります。それらのいずれかにMechanizeのコンテンツをフィードします。
[テキスト内の各単語の画像を作成するための提案](http://stackoverflow.com/a/7820994/46395)の回答を参照してください。 PDF出力がサポートされており、巨大な埋め込みビットマップスクリーンショットではなく、選択可能なテキストと素材を備えた*本物の* PDFになります。このモジュール用のMechanize互換のフロントエンドはまだありませんが、[前のバージョンには1つあります](http://p3rl.org/Gtk2::WebKit::Mechanize )。 – daxim