2017-09-07 12 views
0

に掻き取り後:https://www.newegg.com/Product/ProductList.aspx?Submit=ENE&N=-1&IsNodeId=1&Description=GTX&bop=And&Page= {} &がPageSize = 36 &ため= BESTMATCH」.format(ページ)私はウェブサイトを掻き取るコード書かれたウェブは、Python

を私製品名は、これまでのセルに来るので、価格や画像の上にいるようデータは、formttedされていない、このコードを実行する。

from urllib.request import urlopen 
from bs4 import BeautifulSoup 
f = open("Scrapedetails.csv", "w") 
Headers = "Item_Name, Price, Image\n" 
f.write(Headers) 

for page in range(1,15): 
    page_url = "https://www.newegg.com/Product/ProductList.aspx? 
Submit=ENE&N=-1&IsNodeId=1&Description=GTX&bop=And&Page= 
{}&PageSize=36&order=BESTMATCH".format(page) 
    html = urlopen(page_url) 
    bs0bj = BeautifulSoup(html, "html.parser") 
    page_details = bs0bj.find_all("div", {"class":"item-container"}) 
    for i in page_details: 
     Item_Name = i.find("a", {"class":"item-title"}) 
     Price = i.find("li", {"class":"price-current"}) 
     Image = i.find("img") 
     Name_item = Item_Name.get_text() 
     Prin = Price.get_text() 
     imgf = Image["src"]# to get the key src 
     f.write("{}".format(Name_item).strip()+ ",{}".format(Prin).strip()+ 
    ",{}".format(imgf)+ "\n") 
f.close() 

誰かが私は名前欄に名前を得ることができるようにコードをammendために私を助けることができる、価格で価格列と画像列の画像 新しいものは何ですかcsvでデータを保存する方法、誰かがコードで私を助けることができますか?

答えて

0

申し訳ありませんが解決しました。

from urllib.request import urlopen 
from bs4 import BeautifulSoup 

f = open("Scrapedetails.csv", "w") 
Headers = "Item_Name, Price, Image\n" 
f.write(Headers) 

for page in range(1,15): 
    page_url = "https://www.newegg.com/Product/ProductList.aspx? 
Submit=ENE&N=-1&IsNodeId=1&Description=GTX&bop=And&Page= 
{}&PageSize=36&order=BESTMATCH".format(page) 
    html = urlopen(page_url) 
    bs0bj = BeautifulSoup(html, "html.parser") 
    page_details = bs0bj.find_all("div", {"class":"item-container"}) 
    for i in page_details: 
     Item_Name = i.find("a", {"class":"item-title"}) 
     Price = i.find("li", {"class":"price-current"}).find('strong') 
     Image = i.find("img") 
     Name_item = Item_Name.get_text().strip() 
     prin = Price.get_text() 
     imgf = Image["src"]# to get the key src 


     print(Name_item) 
     print(prin) 
     print('https:{}'.format(imgf)) 
     f.write("{}".format(Name_item).replace(",", "|")+ ",{}".format(prin)+ ",https:{}".format(imgf)+ "\n") 
f.close() 

これらは、最も簡単な方法

をウェブスクレイピングで開始したい人のためのコードです
関連する問題