2011-08-15 11 views
3

私はJavaとJsoupを使ってHTMLページを解析していますが、その中に別のdivが含まれていないすべてのdivを取得して、そこに含まれるテキストを印刷したいとします。内部に別のdivを持たないdiv要素を選択するにはどうすればよいですか?

たとえば、divにテーブルが含まれていて、テーブルcostがdivの場合、私はそれを望んでいません。私はそれの中に他のdivはありません(別のタグは大丈夫です)、最下位レベルのdivだけが欲しいです。

どうすればよいですか?

Primarilly、select()メソッドで使用できる構文があるかどうかを知りたいです。

+0

正規表現を使用して見てください。 http://php.net/manual/en/function.preg-match.php – RSM

答えて

1
Document doc; //comes as parameter 

Elements divs = doc.getElementsByTag("div"); 
for(Element div: divs){ 
    if(div.getElementsByTag("div").size() == 1){ 
     //is a div with no divs inside it 
    } 
} 
関連する問題