2017-04-03 7 views
0

私は、次のHTMLコードを持っている:JSoupのみで外部divテキストを取得するにはどうすればよいですか?

<div class="description"> 
    <div class='daterange'> 
     Hello 
    <span itemprop='startDate'> 
     June 3, 2011 
    </span> 
    </div> 
    This is some description <i>that</i> I want to fetch 
</div><br/> 

を、私は一部だけを抽出したい:私はjsoupでそれを行うことができますどのように

This is some description <i>that</i> I want to fetch 

私はString description = doc.select("div.description").text()を使ってみましたが、その中にあるすべてのコンテンツを取得しています。

答えて

0

必要なのは、htmlファイルの単語を保持するStringを作成することです。 これは、次のコードdoc.body()によって行われます。text()は、すべてのhtmlタグなしでテキストを取得しています。

`public String getWords(String url) { 
     String text = ""; 
     try { 
      Document doc = Jsoup.connect(url).get(); 
      text = doc.body().text(); 
     } catch (IOException ioe) { 
      ioe.printStackTrace(); 
     } 
     return text; 
    } 
` 
+0

フムを試してみてください、私はあなたのアプローチはまた、 'Hello'と' 6月3日、2011'を抽出し、私は私が解決策を見つけたと思う – user3766930

+0

ことを避けたいと思いますあなたの質問は、この答えを確認してください:http://stackoverflow.com/questions/16835878/use-jsoup-extract-certain-part-of-text – Flika205

0

この

String description = doc.select("div").remove().first().html(); 
+0

それは動作しませんでした:( – user3766930

+0

これは正確なHTMLスニペットで動作します。あまりにも大きくない場合は、完全なHTMLページを投稿してください – Reimeus

関連する問題