2016-08-14 12 views
0

私はこのページ(http://www.itjuzi.com/company/934)からのデータを扱っていますが、子供のtdタグを持つリストと親のtdタグを持つリストがあります。複数のtdネストされたタグを持つテーブルからの治療方法

response.xpath("//table[@class='list-round-v2']//tr/td[4]//text()").extract() 

、結果は私は以下のようにしたい:

は、以下のコードは、ある

[["骊悦投资","长山兴资本"], 
["中信产业基金","高瓴资本Hillhouse Capital","IDG资本","北极光创投","DCM中国"]] 

enter image description here

答えて

1

これは、仕事をする

textlist=[] 
for row in response.xpath("//table[contains(@class,'list-round-v2')]//tr"): 
    textlist.append(row.xpath("td[4]//text()[parent::a|parent::span]").extract()) 
関連する問題