2016-05-23 15 views
0

HTTrackまたはWgetを使用しようとしています。ウェブサイトからいくつかの.docxファイルをダウンロードしています。私はこれをフォルダのためだけにしたい、そしてそれはサブフォルダです。例:www.examplewebsite.com/doc(これはさらに5レベル下がります)wgetまたはhttrackを使用して、特定のファイルタイプをフォルダからダウンロードする必要があります(サブフォルダのみ)。

これを行うにはどうすればよいでしょうか?

答えて

2

あなたのintrestのファイルをフィルタするために-r(再帰オプション)で--spider使用し、--acceptを持つことができます

wget --spider -r --accept "*.docx" <url> 
+0

答えにいくつかの説明を追加してください。 –

+0

これはフォルダ構造で出力されますが、ファイルは出力されません。私は延長をチェックした。 .xlsであり、コマンドに適切な変更を加えました。 – NoBlink

0

前回提案の答えは「クモ」オプションを常に持って考えると滑稽です特にDOWNLOADEDではなく、代わりに従っています。

これは決して遅くない方がいいですが、希望のファイル拡張子ファイルをローカルでミラーリングするコマンドですが、ターゲットHTMLをプルダウンして自動調整してローカルで開き、リンクが変更され、ローカルドライブを指すように調整されます。

wget -e robots=off -r -k -A docx,doc "https://<url>" 

これがうまくいく場合、私は答えていただきたいと思います!

関連する問題