2011-07-28 7 views
17

私はどのように私は文字列にdocことを変換します。この私は文字列にJsoup(のJavaのHTMLパーサ)で行われた文書を変換するにはどうすればよい

Document doc = Jsoup.connect("http://en.wikipedia.org/").get(); 

のように見えますjsoupで作られた文書を持っています。

Document doc = Jsoup.connect("http://en.wikipedia.org/").get(); 
String htmlString = doc.toString(); 

としてドキュメント要素を拡張、それはまたAPIによると "要素の内部HTMLを取得します" の方法HTML()を持っている:

答えて

30

は、あなたがしようとしています。だから、動作するはずです:

Document doc = Jsoup.connect("http://en.wikipedia.org/").get(); 
String htmlString = doc.html(); 

追加情報:

を各ドキュメントオブジェクトは、メソッドを介してアクセスすることができ、内部クラスのインスタンスDocument.OutputSettingsへの参照を持っているドキュメントのoutputSettings()ここでは、セッターprettyPrint(true/false)を使用して、きれいな印刷を有効/無効にすることができます。 doc.outerHtml()がそうであるように、furtherinformation

+0

最初のコードブロックは、私に 'html/contentの代わりに' [Ljava.lang.String; @ 383534aa']を与えました。ところで、もしそれが 'Document []'ならば? –

7

doc.toString()作品でドキュメントDocument.OutputSettingsのためのAPIを参照してください。

0
  1. 要素post = d.select( "div.post-content");
  2. String dd = post.toString();
  3. ドキュメントddd = Jsoup.parse(dd);その後、あなたは

    1. 要素scriptTag = ddd.getElementsByTag(「スクリプト」)機能、それを文書に使用することができます文書化した文字列を解析した後

  4. System.out.println(scriptTag);
関連する問題