2016-07-05 6 views
0

このWebサイト(http://nomads.ncep.noaa.gov/pub/data/nccf/com/hourly/prod/)から特定のファイルをダウンロードしようとしていますが、10日間のデータを保持しています。私は "nam_pcpn_anal"で始まるすべてのディレクトリから "ST4"で始まるすべてのファイルをダウンロードしたいと思います。私は次のように一つのフォルダから「ST4」と見つめて、すべてのファイルをダウンロードできます。wgetを使用してパターンを使用して再帰的にパターンを取得する方法

wget -r -nd -N --no-parent -nH --cut-dirs=100 -P ~/test/ -A ST4* 'http://nomads.ncep.noaa.gov/pub/data/nccf/com/hourly/prod/nam_pcpn_anal.20160625/' 

が、私は再帰的ST4を検索する方法を知りません。私は次のことがうまくいくはずだと思ったが、それは駄目だ!

wget -r -nd -N --no-parent -nH --cut-dirs=100 -P ~/test/ -A ST4* --accept nam_pcpn_anal*/ST4* 'http://nomads.ncep.noaa.gov/pub/data/nccf/com/hourly/prod/' 

+0

関連項目[httrack](https://www.httrack.com/)、それが持っている[フィルタ] (https://www.httrack.com/html/filters.html)。 – gavv

答えて

0

wget manualショー:だから

-I list 
    --include-directories=list 
     Specify a comma-separated list of directories you wish to follow 
     when downloading. Elements of list may contain wildcards. 

、あなたが試みることができる:

wget -r -nd -N --no-parent -nH --cut-dirs=100 -P ~/test/ \ 
    -A 'ST4*' -I '*/nam_pcpn_anal.*' \ 
    'http://nomads.ncep.noaa.gov/pub/data/nccf/com/hourly/prod/' 
+0

ありがとう、それは動作するはずです。しかし、私はそれがそうではないことを恐れている。 – newbie

+0

代わりに '-I 'nam_pcpn_anal。*''を使用するとどうなりますか? – jxh

+0

同じですが、何かが私の最後のwgetではないと思います。そうしないと、投稿するソリューションが意味をなさき、うまくいくはずです。 – newbie

関連する問題