ウェブページからすべてのリンクを抽出しようとしましたが、いくつかのコードが試されました。たとえば、私はウェブページ内のすべてのリンクを取得する
from urllib.request import urlopen
import lxml.html
connection = urlopen('http://sentinel-s2-l1c.s3-website.eu-central1.amazonaws.com/')
dom = lxml.html.fromstring(connection.read())
for link in dom.xpath('//a/@href'): # select the url in href for all atags(links)
print(link)
を試してみましたが、しかし、それは他のウェブページのために動作しますが、それは私が抽出したいWebページのために動作しません。私が試みているウェブページは ウェブページ= 'http://sentinel-s2-l1c.s3-website.eu-central-1.amazonaws.com/'
私が知りたいと思う:このウェブサイトは特別なウェブサイトですか?今まで私はAmazon Web Serviceのクラウドストレージを知っています。
このサイトではどうすればいいですか? 私はPythonで新しく、それについての知識はほとんどありません。私の質問の間違いを私に許してください。