2011-04-11 1 views
0

私はPythonでいくつかのWebスクラップをしています。しかし、あなたが知っているように、いくつかのWebページには異なる文字セットがあります。私はそれらのWebページをcharsetにする必要があります。長い話が短い、lxmlのために、xpathパターンとは何ですか?xpathを使った(X)HTML文書のmeta要素のcharset属性を取得する

ありがとうございます。

+0

あなたは 'meta'要素の' content'属性の値を取得する方法を求めていますか? –

+0

はい。それが私が探しているものです。 – wonnie

+0

OK、その後。回答しました。 –

答えて

2

この:

/html/head/meta[@http-equiv='Content-Type']/@content 

HTML5:

/html/head/meta/@charset 
関連する問題