HTTrackまたはWgetを使用しようとしています。ウェブサイトからいくつかの.docxファイルをダウンロードしています。私はこれをフォルダのためだけにしたい、そしてそれはサブフォルダです。例:www.examplewebsite.com/doc(これはさらに5レベル下がります)wgetまたはhttrackを使用して、特定のファイルタイプをフォルダからダウンロードする必要があります(サブフォルダのみ)。
これを行うにはどうすればよいでしょうか?
HTTrackまたはWgetを使用しようとしています。ウェブサイトからいくつかの.docxファイルをダウンロードしています。私はこれをフォルダのためだけにしたい、そしてそれはサブフォルダです。例:www.examplewebsite.com/doc(これはさらに5レベル下がります)wgetまたはhttrackを使用して、特定のファイルタイプをフォルダからダウンロードする必要があります(サブフォルダのみ)。
これを行うにはどうすればよいでしょうか?
あなたのintrestのファイルをフィルタするために-r(再帰オプション)で--spider使用し、--acceptを持つことができます
wget --spider -r --accept "*.docx" <url>
前回提案の答えは「クモ」オプションを常に持って考えると滑稽です特にDOWNLOADEDではなく、代わりに従っています。
これは決して遅くない方がいいですが、希望のファイル拡張子ファイルをローカルでミラーリングするコマンドですが、ターゲットHTMLをプルダウンして自動調整してローカルで開き、リンクが変更され、ローカルドライブを指すように調整されます。
wget -e robots=off -r -k -A docx,doc "https://<url>"
これがうまくいく場合、私は答えていただきたいと思います!
答えにいくつかの説明を追加してください。 –
これはフォルダ構造で出力されますが、ファイルは出力されません。私は延長をチェックした。 .xlsであり、コマンドに適切な変更を加えました。 – NoBlink