私はウェブサイトを掻き取るコード書かれたウェブは、Python

に掻き取り後：https://www.newegg.com/Product/ProductList.aspx?Submit=ENE&N=-1&IsNodeId=1&Description=GTX&bop=And&Page= {} &がPageSize = 36 &ため= BESTMATCH」.format（ページ）私はウェブサイトを掻き取るコード書かれたウェブは、Python

を私製品名は、これまでのセルに来るので、価格や画像の上にいるようデータは、formttedされていない、このコードを実行する。

from urllib.request import urlopen 
from bs4 import BeautifulSoup 
f = open("Scrapedetails.csv", "w") 
Headers = "Item_Name, Price, Image\n" 
f.write(Headers) 

for page in range(1,15): 
    page_url = "https://www.newegg.com/Product/ProductList.aspx? 
Submit=ENE&N=-1&IsNodeId=1&Description=GTX&bop=And&Page= 
{}&PageSize=36&order=BESTMATCH".format(page) 
    html = urlopen(page_url) 
    bs0bj = BeautifulSoup(html, "html.parser") 
    page_details = bs0bj.find_all("div", {"class":"item-container"}) 
    for i in page_details: 
     Item_Name = i.find("a", {"class":"item-title"}) 
     Price = i.find("li", {"class":"price-current"}) 
     Image = i.find("img") 
     Name_item = Item_Name.get_text() 
     Prin = Price.get_text() 
     imgf = Image["src"]# to get the key src 
     f.write("{}".format(Name_item).strip()+ ",{}".format(Prin).strip()+ 
    ",{}".format(imgf)+ "\n") 
f.close()

誰かが私は名前欄に名前を得ることができるようにコードをammendために私を助けることができる、価格で価格列と画像列の画像新しいものは何ですかcsvでデータを保存する方法、誰かがコードで私を助けることができますか？

出典

2017-09-07 Mr.Bones

申し訳ありませんが解決しました。

from urllib.request import urlopen 
from bs4 import BeautifulSoup 

f = open("Scrapedetails.csv", "w") 
Headers = "Item_Name, Price, Image\n" 
f.write(Headers) 

for page in range(1,15): 
    page_url = "https://www.newegg.com/Product/ProductList.aspx? 
Submit=ENE&N=-1&IsNodeId=1&Description=GTX&bop=And&Page= 
{}&PageSize=36&order=BESTMATCH".format(page) 
    html = urlopen(page_url) 
    bs0bj = BeautifulSoup(html, "html.parser") 
    page_details = bs0bj.find_all("div", {"class":"item-container"}) 
    for i in page_details: 
     Item_Name = i.find("a", {"class":"item-title"}) 
     Price = i.find("li", {"class":"price-current"}).find('strong') 
     Image = i.find("img") 
     Name_item = Item_Name.get_text().strip() 
     prin = Price.get_text() 
     imgf = Image["src"]# to get the key src 


     print(Name_item) 
     print(prin) 
     print('https:{}'.format(imgf)) 
     f.write("{}".format(Name_item).replace(",", "|")+ ",{}".format(prin)+ ",https:{}".format(imgf)+ "\n") 
f.close()

これらは、最も簡単な方法

をウェブスクレイピングで開始したい人のためのコードです

出典

2017-09-07 18:38:20

私はウェブサイトを掻き取るコード書かれたウェブは、Python

答えて

関連する問題