2017-03-29 10 views
1

は、以下のNUMERO D'arrêtある原因としてJsoup要素をキャスト:5216とNUMERO NOR:63066、しかし何も何かアドバイスや提案は非常に理解されるであろう作品に思わない:TextNodeが例外jsoupを使用して解析しようとしています何

を`

<div class="1st"> 
<p> 
<h3>Numérotation : </h3> 
Numéro d'arrêt : 5216 
<br /> 
Numéro NOR : 63066 
</div> 

`

UPDATE:

私が動作するようにこのコードを得たが、それは私にこの例外を与え続けるorg.jsoup.nodes.El ementはorg.jsoup.nodes.TextNodeにキャストすることはできません。

Document tunisie = Jsoup.connect("http://www.juricaf.org/arret/TUNISIE-COURDECASSATION-20060126-5216").get(); 

for (Element titres : tunisie.select("div.arret")){ 

        String titre = titres.select("h1#titre").first().text(); 
        System.out.println(titre); 
        System.out.println("\n"); 
       } 


       for (Element node : tunisie.select("h3")) { 
        TextNode numérodarrêt = (TextNode) node.nextSibling(); 
        System.out.println(" " + numérodarrêt.text()); 
        System.out.println("\n"); 

       } 

       //NuméroNOR et Identifiant URN LEX 
       for (Element element2 : tunisie.select("br")) { 
        TextNode NuméroNOR_IdentifiantURNLEX = (TextNode) element2.nextSibling(); 
        System.out.println(" " + NuméroNOR_IdentifiantURNLEX.text()); 
        System.out.println("\n"); 
       } 

UPDATE:ここ

は、画像リンクを解析しようとしているものです以下の通りです。

Parsing text outside html tags

+0

あなたが共有するためのいくつかのコードを持っていますか?あなたはどこにいるのですか? – Akah

+0

私はちょっとした問題を解決しましたが、それは私に例外を与えます。上記のコードの更新を確認してください。 – Asomuth

答えて

0
import org.jsoup.Jsoup; 
import org.jsoup.nodes.Document; 
import org.jsoup.nodes.Element; 

public class JsoupTest { 

    public static void main(String[] args) throws IOException { 
     Document tunisie = Jsoup.connect("http://www.juricaf.org/arret/TUNISIE-COURDECASSATION-20060126-5216").get(); 
     // get the first div in class arret 
     Element arret = tunisie.select("div.arret").first(); 
     // select h1 tag by its ID to get the title 
     String titre = arret.select("#titre").text(); 
     System.out.println(titre); 
     // to get the text after h3 select h3 and go to next sibling 
     String txtAfterFirstH3 = arret.select("h3").first().nextSibling().toString(); 
     System.out.println(txtAfterFirstH3); 
     // select first br by its index; note first br has the index 0; and call nextSibling to get the text after the br tag 
     String txtAfterFirstBr = arret.getElementsByTag("br").get(0).nextSibling().toString(); 
     System.out.println(txtAfterFirstBr); 
     // the same as above only with next index 
     String txtAfterSecondBr = arret.getElementsByTag("br").get(1).nextSibling().toString(); 
     System.out.println(txtAfterSecondBr); 
    } 
} 
+0

ありがとうございました。要素インデックスを使うことはできませんでした。説明をありがとう私は本当にそれを感謝します。 – Asomuth

+0

助けてくれてうれしいです。どういたしまして。 – Eritrean

1
String html = "<div class=\"1st\">\n" + 
         "<p>\n" + 
         "<h3>Numérotation : </h3>\n" + 
         "Numéro d'arrêt : 5216\n" + 
         "<br />\n" + 
         "Numéro NOR : 63066\n" + 
        "</div>"; 

Document doc = Jsoup.parse(html); 
Elements divs = doc.select("div.1st"); 
for(Element e : divs){ 
     System.out.println(e.ownText()); 
} 
+0

私は構文解析したいものではありませんでした^^ – Asomuth

関連する問題