2017-05-13 9 views
0

で解析、私のpythonにxlmlとXPathを使用して列(名前とタイトル、職業、レベル)を取得する必要があります。が、私はこのウェブサイトでは、ウェブサイト</p> <p>の特定のテーブルを解析しようとしているlxmlのとXPath

これまでのところ、私はこのコードを持っている:

import lxml.html 
import requests 
from lxml import html 


url = "http://www.tibia.com/community/?subtopic=guilds&page=view&GuildName=Black%20Widow" 
html = lxml.html.parse(url) 
list = html.xpath("//table[@class='TableContent'][1]/tr/td[2]/text()") 

listは私の最初の列「の名前とタイトル」のテキストを与えることとしたが、私が受けてること'\xa0'

の完全なリストですが

私はHTML agility packを使ってvb.netで同じコードを作っていました。滑らかに走りました。ここにvb.netアプリケーションのコードを投稿して、私がしたいことをより良く見ることができます。

答えて

0

あなたがXPath下に試すことができ"Name and Title"列から値を取得する必要がある場合:

//table[@class='TableContent']//td/a/text() 

またそれがPythonビルトインクラス

の名前であるとして、あなたは変数名として "list"を使用してはならないことに注意してください
+0

私が探しているものは素晴らしく、今はmysqlデータテーブルにそれらの情報を渡す方法を学び始めます:D –

関連する問題