私はこのHTMLテーブルをPython 3.6でBeautifulSoupでスクラップして、下のスクリプトのようにcsvにエクスポートしようとしています。私は前例を使用して、私の場合に合っていました。Htmlテーブルのスクラップとcsv:属性へのエクスポートエラー:
url = 'http://finanzalocale.interno.it/apps/floc.php/certificati/index/codice_ente/2050540010/cod/4/anno/2015/md/0/cod_modello/CCOU/tipo_modello/U/cod_quadro/03'
html =urlopen(url).read
soup = BeautifulSoup(html(), "lxml")
table = soup.select_one("table.tabfin")
headers = [th.text("iso-8859-1") for th in table.select("tr th")]
ただし、私はAttributeErrorを受け取ります。
AttributeError: 'NoneType' object has no attribute 'select'
それから私は、これで間違って何
with open("abano_spese.csv", "w") as f:
wr = csv.writer(f)
wr.writerow(headers)
wr.writerows([[td.text.encode("iso-8859-1") for td in row.find_all("td")] for row in table.select("tr + tr")])
でCSVファイルにエクスポートしようとするのでしょうか?何かばかげたエラーがあればごめんなさい、私はPythonの初心者です。
はMinistero dell'InternoのWebサイトのスクレイピングに問題がありますすべての
私はカスタムヘッダーを渡してみましたが、同じ応答があります。 'r = requests.get(url、headers = {' User-Agent ':' Mozilla/5.0(iPad; U; CPU OS Mac OS Xのような3_2_1; en-us)AppleWebKit/531.21.10(GeckoのようなKHTML)Mobile/7B405 '})' 残念ながら、データは他の場所では利用できないようです。 – Alejo
@Alejoの回答が更新されました – floatingpurr
ありがとうございます@floatingpurr!心配しないでください、あなたは丁寧になっています。法律上の注意によれば、データ操作に制約はないようだ。 – Alejo