こんにちは、私はJSOUPを使用してウェブサイトを削り取る必要があります。私はキーと値のペアを出力する必要があります。JSOUPデータを削る
package com.jaysons;
import java.io.IOException;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
public class ScrapeBody {
public static void main(String[] args) throws IOException{
String url = "https://www.cpsc.gov/Recalls?field_rc_date_value%5Bmin%5D&field_rc_date_value%5Bmax%5D&field_rc_heading_value=&field_rc_hazard_description_value=&field_rc_manufactured_in_value=&field_rc_manufacturers_value=&field_rc_number_value=";
Document doc = Jsoup.connect(url).get();
Elements content = doc.select("div.views-field views-field-php");
doc = Jsoup.parse(content.html().replaceAll("</div>", "</div><span>")
.replaceAll("<div", "</span><div"));
Elements labels = doc.select("div.remedy");
for (Element label : labels) {
System.out.println(String.format("%s %s", label.text().trim(),
label.nextElementSibling().text()));
}
}
}
私は
日のようなキーと値のペアで出力を必要とする:
私はsrapeする必要があるURLは、私が書いたコードがあるhttps://www.cpsc.gov/Recalls?field_rc_date_value%5Bmin%5D&field_rc_date_value%5Bmax%5D&field_rc_heading_value=&field_rc_hazard_description_value=&field_rc_manufactured_in_value=&field_rc_manufacturers_value=&field_rc_number_value=
である2017年10月20日
救済:
単位:
ウェブサイト:http://www.bosch-home.com/us
電話:(888)965から5813
私は間違いをどこにしたか教えてください
これまでに何を試しましたか?あなたの質問は何ですか? StackOverflowはコード作成サービスではありません。どこから始めたらいいか分からない場合は、[cookbook](https://jsoup.org/cookbook/)などのプロジェクトドキュメントをチェックすることができます。 – ventiseis
私は多くのバージョンを試してみましたが、何も動作していないようですので、私はいくつかの助けを求めていました - ventiseis – vyas
あなたが試したことを示してください。 – sina