私は、WebページからファイルをダウンロードするためのPythonでいくつかのコードを書いています。どんなサイトからでもファイルをダウンロードする方法がわからないので、そのサイトからのファイルリンクだけを掻き取ることができます。誰かが私がそれを達成するのを手助けできるなら、私は彼にとても感謝しています。ありがとうございます。そのサイトへ特定のWebサイトからファイルをダウンロードできません
リンク:実行されると
from bs4 import BeautifulSoup
import requests
response = requests.get("http://usda.mannlib.cornell.edu/MannUsda/viewDocumentInfo.do?documentID=1194")
soup = BeautifulSoup(response.text,"lxml")
for item in soup.select("#latest a"):
print(item['href'])
は、上記のスクリプトは、それらのファイル4つの異なるURLを生成します。ここではweb_link
は私の試みです。
ラッキートゥーアールアレクセがあります。久しぶり。しかし、 'print'行にぶつかるときに私が直面している少しの問題です。それはそこで壊れます。 – SIM
@Topto例のように接頭辞 'f'の文字列を使用するにはPython 3.6を使用する必要がありますが、古い' print( "Downloaded"、local_filename) ' – furas