すべてのサイトコンテンツをダウンロードし、ダウンロードした「* .pdf」ファイルのフォルダを解析する必要があります。私はwget -r --no-parent http://www.example.com/
を使用してサイトをダウンロードしています。しかし、問題は、それがこのように見えない、時々リンクが指定されていないファイル形式「= K20 fは?dpubs」このWgetファイル形式
http://www.foodmanufuture.eu/dpubs?f=K20
とdowloaded PDFは名前でダウンロードされるように見えるということです"dpubs?f = K20.pdf"、このフォルダにあるPDFファイルの数を確認する方法はありますか?
素晴らしい!ありがとうございました! –