xpathを使った（X）HTML文書のmeta要素のcharset属性を取得する

私はPythonでいくつかのWebスクラップをしています。しかし、あなたが知っているように、いくつかのWebページには異なる文字セットがあります。私はそれらのWebページをcharsetにする必要があります。長い話が短い、lxmlのために、xpathパターンとは何ですか？xpathを使った（X）HTML文書のmeta要素のcharset属性を取得する

ありがとうございます。

出典

2011-04-11 wonnie

あなたは 'meta'要素の' content'属性の値を取得する方法を求めていますか？ –

はい。それが私が探しているものです。 – wonnie

OK、その後。回答しました。 –

この：

/html/head/meta[@http-equiv='Content-Type']/@content

HTML5：

/html/head/meta/@charset

出典

2011-04-11 01:21:43

xpathを使った（X）HTML文書のmeta要素のcharset属性を取得する

答えて

関連する問題