私はウェブサイトを解析するAndroidアプリケーションに取り組んでいますが、Jsoupを動作させることはできません。私はこのHTMLを解析しようとしていますJSoup解析の問題
:
私のコード今は次のとおりです。
Document doc = null;
try{
doc = Jsoup.connect("URL").get();
Elements tds = doc.select("table.tr>td");
for (Element td : tds) {
String tdText = td.text();
System.out.println(tdText);
}
}
現時点では何も返しませんが、私は「ドキュメント」、それを印刷する場合ウェブサイト全体を返す。 Drower、E. S. (エセルStefana)、 レディ、 B:
は、私は、以下の情報を抽出しようとしています。 1879、& nbspありまたはなし。しかし、私はそれが動作するように継ぎ合せることはできません。
ありがとうございました!
クラスに '.'はありませんか?子供は 'foo> bar> baz'です。 –
私はあなたがそれらを混ぜることができる印象の下にあった。混合した例ではなく、どうすればよいでしょうか。私は本当にここに迷っています。 – Tbuermann
あなたはそれらを混ぜることができますが、あなたのセレクターはまだ間違っています。クラス 'tr'を持つ' table'要素の 'td'子を選択しています。代わりに 'td'セルを' table'の 'tr'行に入れたいと思うでしょう。セレクタとして '' td ''を使うだけで、あなたがそれらに乗ることができると思います。しかし、あなたが望む情報だけを抽出するのは難しいでしょう。それを含む 'td'には' id'やページの他の 'td'要素から分離する可能性のある他の独自の特性がないからです。その特定のテーブルの2番目の行の3番目のセル? –