2017-05-10 5 views
0

htmlページが2つあるとします。ページ1とページ2div-classまたはdiv-idの末尾からjsoupの内容でデータを抽出する

のPage1は

<div class="content"> 
<p></p> 
<p></p> 
</div> 

ようなHTMLが含まれているとPAGE2は今、私はそれがあれば言って、このコードで

Document document = Jsoup.connect(url).get(); 
      Elements links = document.select("div[class~=content$]"); 

       for (Element heading2 : links) { 
       Elements p = heading2.select("p"); 
       for (Element ptext : p) { 
        System.out.println(ptext.text()); 
          } 
           } 

ようjsoupパーサを書いた

<div id="main-content"> 
<p></p> 
<p></p> 
<p></p> 
</div> 

ようなHTMLが含まれていますdiv クラスには終わりその後、私の質問は<div>IDまたはクラスcontentが含まれているかどうかをチェックするためにどのような方法があります...それはデータを解析しますが、ページがdiv id="content"が含まれている場合、それはそれはカントofcourseのdata..iが知っているpasreカントdiv id/classの最後に解析しますか?

答えて

0

カンマを使用して、いくつかのセレクタを互いに独立して指定することができます。したがって、<div id="main-content">とその他を検索するものを作成することができます。<div class="content">

.select("div[id~=content$], div[class~=content$]"); 
関連する問題