オンラインライブラリー "EnriqueBolaños"(http://enriquebolanos.org)からをwget
でたくさんダウンロードしたいと考えています。彼らは彼らで出版、電子の日付を持っている:組織的に変化するURLからwgetを使ってすべてのpdfをダウンロードするには?
私がダウンロードしたいと最初pdf
とのリンクは
http://sajurin.enriquebolanos.org/vega/docs/G-1961-01-02.pdf
他のすべてのpdf
は、特定のパターンに従うurl
によってリンクされています。 g。 Januar 3 1961用
:http://sajurin.enriquebolanos.org/vega/docs/G-1961-01-04.pdf:Januar 4 1961用http://sajurin.enriquebolanos.org/vega/docs/G-1961-01-03.pdf
。私は一度wget
で Dezember 19、1997にJanuar 2、1961年から利用可能なすべてのpdf
をダウンロードすることができますどのように
?
これが不可能な場合は、どのように私はすべての
pdf
における出版の 一年間wget
、電子をダウンロードすることができます。 g。最初のすべてpdf
1961年から1962年など?
私はJanuar 1961でのみ利用可能なすべてのpdf
をダウンロードし、その結果、これまでのところ、このコマンドを持っている:
wget -A pdf -nc -E -nd http://sajurin.enriquebolanos.org/vega/docs/G-1961-01-0{1..31}.pdf
編集:
wget -A pdf -nc -E -nd http://sajurin.enriquebolanos.org/vega/docs/G-19{61..97}-0{1..9}-{01..31}.pdf http://sajurin.enriquebolanos.org/vega/docs/G-19{61..97}-{10..12}-{01..31}.pdf
:は、私は今、次のコマンドを持っていますしかし、wget
はそれが私にそれを伝えます
Argument list too long
回避策はありますか?
私は無駄に続くループを試してみました:
for ((i=61; i<=$97; i++)) ; do wget -A pdf -nc -E -nd http://sajurin.enriquebolanos.org/vega/docs/G-19$i-0{1..9}-{01..31}.pdf http://sajurin.enriquebolanos.org/vega/docs/G-19$i-{10..12}-{01..31}.pdf ; done