私はPythonの初級者です。私はちょうどamazonページの製品リンクをスクラップしたいと思います。 には、例えば、私はこのページ http://www.amazon.com/s/ref=sr_in_-2_p_4_18?me=A3MZ96G5C78IVQ&fst=as%3Aoff&rh=p_4%3AFunKo&ie=UTF8&qid=1477811368をスクラップしたいと私はちょうど出力などの製品のタイトルリンクをしたいのpythonPythonを使用してamazon製品のリンクを抽出する方法
from bs4 import BeautifulSoup
import requests
url = "http://www.amazon.com/s/ref=sr_in_-2_p_4_18?me=A3MZ96G5C78IVQ&fst=as%3Aoff&rh=p_4%3AFunKo&ie=UTF8&qid=1477811368"
r = requests.get(url)
soup = BeautifulSoup(r.content, "lxml")
file = open("parseddata.txt", "wb")
links = soup.find_all('a', {'class': 'a-link-normal s-access-detail-page a-text-normal'})
for link in links:
print(link.get('href'))
file.write(href + '\n')
file.close()
でこのコードを使用します。誰が私が間違っているのか教えてもらえますか?
あなたはあなたのコードが何をする期待し、それが実際に何をするのでしょうか?エラーメッセージや警告が表示されますか?結果は間違っていますか?もしそうなら、どんな点で? –
@Gurpeet Singhあなたはこれをやってはいけません(何か深刻なことがあれば)、開発者のためにアマゾンにapiがあることを知って欲しいですか? – danidee