こんにちはJavaの専門家 "div id"の下に情報が隠されている特定のURLアドレスからデータを抽出しようとしています。私のURLクエリページは次のようになります:DIV IDの下に隠された値を抽出する
私は自分のクエリとしてペプチドシーケンスを与えています。そして、 "Search Dataset"ボタンをクリックして結果をテーブルとして表示します。
しかし、「ページソースを表示」して結果をHTMLとして表示しようとしていて、そのテーブルが表示されませんでした。
「放火魔」を使用した後、私はHTMLでそのテーブルを参照することができ、それは次のようになります。
[![[]ここに画像の説明を入力2] [2]
データを取得するためには、私のクエリのために、私は単純なJavaスクリプトを書いた:
package retrieve.information;
import java.io.IOException;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
public class DemoExtractHidenHtml {
public static void main(String[] args) {
Document document;
try {
document = Jsoup.connect("http://example.com/xyz_proxi.jsp#{\"searched_button\":\"datasets\",\"peptide\":\"NLAVSQVVHK\"}").userAgent("Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/535.21 (KHTML, like Gecko) Chrome/19.0.1042.0 Safari/535.21").get();
Element dataset = document.select("td.table[datasets]_row[0]_column[1]").first();
System.out.println(dataset);
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
}
そして、もちろん、それは私のために働いていないと、私は次のエラーを取得しています:
Exception in thread "main" org.jsoup.select.Selector$SelectorParseException: Could not parse query 'td.table[datasets]_row[0]_column[1]': unexpected token at '_row[0]_column[1]'
at org.jsoup.select.QueryParser.findElements(QueryParser.java:196)
at org.jsoup.select.QueryParser.parse(QueryParser.java:65)
at org.jsoup.select.QueryParser.parse(QueryParser.java:39)
at org.jsoup.select.Selector.<init>(Selector.java:84)
at org.jsoup.select.Selector.select(Selector.java:106)
at org.jsoup.nodes.Element.select(Element.java:286)
at retrieve.information.DemoExtractHidenHtml.main(DemoExtractHidenHtml.java:14)
誰もがこの問題を克服する方法を知っており、私はJavaの初心者です。