-4
私はこのデータを解決するための多くの方法を試していますが、うまくいきません。 strip()
とreplace()
の方法は、写真1のように見えますが、動作しません。私を助けてください。私は日付を簡潔にしようとしていますが、うまくいきません。
` improt requests
from lxml import html,etree
from selenium import webdriver
import time
file_name = 'dubanxinlixue.json'
driver = webdriver.Chrome()
url_string = []
name_data, price_data = [], []
jd_goods_data = {}
page = 0
while True:
url = 'https://book.douban.com/tag/%E5%BF%83%E7%90%86%E5%AD%A6?start={page}&type=S'.format(page=page)
url_string.append(url)
page += 20
if page > 980:
break
for i in url_string:
driver.get(i)
base_html = driver.page_source
selctor = etree.HTML(base_html)
j = 1
for j in range(20):
j += 1
name = '//*[@id="subject_list"]/ul/li[%d]/div[2]/h2/a[1]/@title'%(j)
get_name =selctor.xpath(name)[0]
describe = '//*[@id="subject_list"]/ul/li[%d]/div[2]/div[1]/text()'%(j)
get_describe = selctor.xpath(describe)[0]
get_describe.string.strip()
print(get_describe)`
the get_describe looks like this ,[the result of get_describe][1]
それはあなたが達成しようとしているものを完全に不明です。希望の出力を説明し、あなたの質問にどのように作用するかを記述します。 – gonczor
質問をクリアすることはできますか? – Metareven
GonczorとMetarevenのサポートに感謝しますが、私はエラーを見つけました。非常にありがとうございます –