2017-02-21 11 views
2

私はXPathの概念を全く新しくしています。私はXPathを非常に基本的に理解しています。 私はまずHTMLページ上のWeb要素を見つけるためにXPathを使い始めました。XPathは、主にHtml、XML、またはXHTMLで使用されますか?

ウェブ(動画とテキスト)を検索しているうちに、すべてのXPathチュートリアルはXML(HTMLページではない)に関連していることがわかりました。

ウィキ言い、

のXPath(XML Path Language)は、XML文書からノードを選択するためのクエリ言語です。

これは私をたくさん混乱させました。

  1. HTML文書にXPathは使用されていませんか?
  2. HTML、XML、XHTMLのXPathを書く上で基本的な/構造的な違いはありますか?

私はこの質問が以下のレベルであることを理解していますが、ここではまったく混乱していないことをご理解ください。

+1

http://stackoverflow.com/questions/17642286 –

+0

XPath 3.1でもJSONをサポートしています – Alohci

答えて

1

あなたは混乱する権利があります。

XPathは、一般にマークアップがwell-formedであると仮定しているデータモデルに対して動作します。定義上、XMLとXHTMLは必ず整形式です。 HTMLである必要はありません。しかし、HTMLパーサは、入力として受け入れることが自由であるという精神のもとに、XPathに適したデータモデルにしっかりしていないマークアップを、しばしば首尾よく解析することができます。

したがって、通常はHTMLとともにXPathを使用することもできます。この方法でXPathを使用することは、実際には、一般的なWebページスクレイピング技術です。

+0

strange!このページには別の回答がありましたが、その人は答えを削除しました。 – dheer

関連する問題