2016-11-22 10 views
-2

と私は私がすることを試みたJsoup選択HTMLタグはJsoup

<html> 
<head></head> 
<body> 
..... 
</body> 
</html> 

持つすべてのHTMLタグコードを選択します:それははっきりしていない

Document dc = Jsoup.parse(fichier, "utf-8"); 
String tags = dc.outerHtml(); 
+2

...とあなたの試みからの出力何でしたか?私たちがあなたの質問を手助けするためには、より多くの文脈が必要です:[良い質問をする方法](http://stackoverflow.com/help/how-to-ask)のガイドラインをチェックしてください。 – emunsing

+0

どのようなものを正確に選択したいのか、どのようにコードを取得するのと違うのでしょうか? – Pshemo

答えて

1

あなたの質問に、あなたが単純にしたいようですすべてのタグノード名を取得して、HTMLとgetAllElements()を解析してから、リスト要素を繰り返して、のコードを利用できるようにjava 8を使用して、それぞれnodeName()を取得します。

import org.jsoup.Jsoup; 
import org.jsoup.nodes.Document; 
import org.jsoup.select.Elements; 

public class JSoup { 

    public static void main(String[] args) { 

     String fichier = "<html>" + 
          "<head></head>" + 
          "<body></body>" + 
          "</html>"; 
     Document dc = Jsoup.parse(fichier, "utf-8"); 
     Elements elements = dc.getAllElements(); 
     elements.forEach(element -> System.out.println(element.nodeName())); 
    } 
} 

このコードを印刷すべてのタグノード名:

#document 
html 
head 
body