を解析:オープンJsoupとの接続には、ステータスコードを取得し、私は次の操作を行いますjsoupを使用してクラスを作成していた文書
- コンストラクタはURLへの接続をオープンします。
- ページのステータスを確認する方法があります。すなわち200、404など
- 私はページを解析し、URLのリストを返すメソッドを持っている。#
以下は、私のようにその非常にラフではない、私がやろうとしています何の大まかな作業であります「私は、私が文書を解析して取得する方法がわからないあなたは、私がページのステータスを取得することができます見ることができるようにさまざまなものがたくさんに
public class ParsePage {
private String path;
Connection.Response response = null;
private ParsePage(String langLocale){
try {
response = Jsoup.connect(path)
.userAgent("Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/535.21 (KHTML, like Gecko) Chrome/19.0.1042.0 Safari/535.21")
.timeout(10000)
.execute();
} catch (IOException e) {
System.out.println("io - "+e);
}
}
public int getSitemapStatus(){
int statusCode = response.statusCode();
return statusCode;
}
public ArrayList<String> getUrls(){
ArrayList<String> urls = new ArrayList<String>();
}
}
をしようとしますが、コンストラクタから、すでに開いている接続を使用してきまし試してみました:
Document doc = connection.get();
しかし、それはないです。助言がありますか?これについてもっと良い方法がありますか?
も次のようになりますあなたの接続
を作成することができます
response.statusCode()
は、ステータスコード戻ります、ありがとう! – Peck3277