私は、コミュニティのウェブサイトでホストされているいくつかのファイルタイプをアーカイブしようとしています。wgetで特定のファイルタイプをダウンロードしようとするのはどうですか?
私はwget -r -np -nd -e robots=off -l 0 URL
を使用して必要なファイルをすべてダウンロードすることができますが、ダウンロードと削除の両方の時間を浪費するために約60,000余分なファイルが残ります。
私は実際には拡張子 "tbt"と "zip"のファイルを探しています。 -A tbt,zip
を入力に追加すると、wgetは1つのファイル "index.html.tmp"のみをダウンロードします。これは、指定されたファイルタイプと一致しないため、このファイルをただちに削除し、プロセスが完全に停止し、wgetが終了したことを通知します。 -A
フラグが含まれていない場合、他のファイルをダウンロードしようとしません。
私は間違っていますか? 1つのファイルだけを見ただけでファイルタイプを指定するのはなぜですか?
私はこの種のもののために 'wget'の代わりに[httrack](httwww://www.httrack.com/)を勧めている人もいます。 – larsks