0
は、私は次のようにwarc
アーカイブを作成するためにwgetを実行して、個々のファイルの書き込み防止:wgetの--warcファイル--recursive、
$ wget --warc-file=/tmp/epfl --recursive --level=1 http://www.epfl.ch/
$ l -h /tmp/epfl.warc.gz
-rw-r--r-- 1 david wheel 657K Sep 2 15:18 /tmp/epfl.warc.gz
$ find .
./www.epfl.ch/index.html
./www.epfl.ch/public/hp2013/css/homepage.70a623197f74.css
[...]
は私だけepfl.warc.gz
ファイルが必要です。 wget
がすべての個別ファイルを作成しないようにするにはどうすればよいですか?
次のように私が試した:個々のファイルの
$ wget --warc-file=/tmp/epfl --recursive --level=1 --output-document=/dev/null http://www.epfl.ch/
ERROR: -k or -r can be used together with -O only if outputting to a regular file.
私は、データの複製を避ける方法があるかどうかだけを尋ねていました。 –