2016-10-21 18 views
2

私のプログラムから未使用のhtmlタグと属性を削除しようとしています。Jsoupは未使用の要素を削除します

私はすでに必要な要素を持っています。しかし、この結果の一部の要素は不要であり、削除する必要があります。それらを削除するには?

Elements tes = doc.select("div.pd__content__row"); 
Elements spesifikasiProductContent = tes.select("[class=pd__spec__table]"); 
System.out.println(spesifikasiProductContent); 

結果:

<table class="pd__spec__table"> 
<tbody> 
<tr> 
    <td>Isi</td> 
    <td>750ml</td> 
    </tr> 
    <tr> 
    <td>Material</td> 
    <td>Tritan Material, ABS Plastic</td> 
    </tr> 
    <tr> 
    <td>Dimensi</td> 
    <td>21 X 15 X 3 Cm</td> 
    </tr> 
    <tr> 
    <td>Lain-lain</td> 
    <td>Dimensi : A5 <br> min. -20C, Max. 120C</td> 
    </tr> 
    <tr> 
    <td>Sertifikasi</td> 
    <td>CE/EU, CIQ, EEC, FDA, LFGB, SGS</td> 
    </tr> 
    <tr> 
    <td>Volume</td> 
    <td>&lt; 0.500 L</td> 
    </tr> 
</tbody> 
</table> 

期待される結果:

Isi 750ml 
Material Tritan Material, ABS Plastic 
Dimensi 21 X 15 X 3 Cm 
Lain-lain 
Dimensi : A5 <br> min. -20C, Max. 120C 
Sertifikasi CE/EU, CIQ, EEC, FDA, LFGB, SGS 
Volume &lt; 0.500 L 

答えて

1

使用textnodes取得する行要素にtext()方法:

とそのすべての子要素の結合されたテキストを取得します。空白は正規化され、トリムされます。 の例については、<p>Hello <b>there</b> now! </p>p.text()が返されます。 「こんにちは!

戻り値:

エンコードされていないテキスト、または空の文字列。存在しない場合。

サンプルコード

List<String> featureTitleCleaned = new ArrayList<>(); 
Elements tes = doc.select("div.pd__content__row"); 
Elements spesifikasiProductContent = tes.select("[class=pd__spec__table]"); 

String cleaned = ""; 
for (Element element : spesifikasiProductContent) { 
    for (Element rowElement : element.select("tr")) { 
     cleaned += rowElement.text()+"\n"; 
    } 
    featureTitleCleaned.add(cleaned); 
    cleaned = ""; 
} 

for (String listElement : featureTitleCleaned) { 
    System.out.println(listElement); 
} 

出力

Isi 750ml 
Material Tritan Material, ABS Plastic 
Dimensi 21 X 15 X 3 Cm 
Lain-lain Dimensi : A5 min. -20C, Max. 120C 
Sertifikasi CE/EU, CIQ, EEC, FDA, LFGB, SGS 
Volume < 0.500 L 
+0

は、それがうまく機能そんなにありがとう –

+1

あなたは、私は助けることができ嬉しい歓迎されています。 –

+0

こんにちは、まだそこにいますか? –

関連する問題