2017-05-08 5 views
-4

私はこのデータを解決するための多くの方法を試していますが、うまくいきません。 strip()replace()の方法は、写真1のように見えますが、動作しません。私を助けてください。私は日付を簡潔にしようとしていますが、うまくいきません。

` improt requests 
    from lxml import html,etree 
    from selenium import webdriver 
    import time 


    file_name = 'dubanxinlixue.json' 

    driver = webdriver.Chrome() 
    url_string = [] 
    name_data, price_data = [], [] 
    jd_goods_data = {} 
    page = 0 
    while True: 

     url = 'https://book.douban.com/tag/%E5%BF%83%E7%90%86%E5%AD%A6?start={page}&type=S'.format(page=page) 
     url_string.append(url) 
     page += 20 
     if page > 980: 
      break 

    for i in url_string: 
     driver.get(i) 
     base_html = driver.page_source 
     selctor = etree.HTML(base_html) 
     j = 1 
     for j in range(20): 
      j += 1 

      name = '//*[@id="subject_list"]/ul/li[%d]/div[2]/h2/a[1]/@title'%(j) 
      get_name =selctor.xpath(name)[0] 
      describe = '//*[@id="subject_list"]/ul/li[%d]/div[2]/div[1]/text()'%(j) 
     get_describe = selctor.xpath(describe)[0] 

     get_describe.string.strip() 
     print(get_describe)` 

the get_describe looks like this ,[the result of get_describe][1] 
+2

それはあなたが達成しようとしているものを完全に不明です。希望の出力を説明し、あなたの質問にどのように作用するかを記述します。 – gonczor

+1

質問をクリアすることはできますか? – Metareven

+0

GonczorとMetarevenのサポートに感謝しますが、私はエラーを見つけました。非常にありがとうございます –

答えて

0
new_get_describe = get_describe.strip() 
print(new_get_describe) 
関連する問題