2017-12-06 5 views
0

- 私Jsoupを使用して、このアマゾンのページで本の著者を抽出しようとしている:LinkJsoupを使用して本の著者を抽出するにはどうすればよいですか?

enter image description here

私はtittlesこすりすることができました:

public static final String URL_LITERATURE_FICTION="https://www.amazon.com/b/ref=s9_acss_bw_en_BGG15eve_d_1_6_w?_encoding=UTF8&node=17&pf_rd_m=ATVPDKIKX0DER&pf_rd_s=merchandised-search-top-3&pf_rd_r=8Z2ERCN30FREH3ZD6AHC&pf_rd_r=8Z2ERCN30FREH3ZD6AHC&pf_rd_t=101&pf_rd_p=c0b03f4d-c947-45e3-9b66-2bd220509181&pf_rd_p=c0b03f4d-c947-45e3-9b66-2bd220509181&pf_rd_i=283155"; 
Document doc = Jsoup.connect(URL_LITERATURE_FICTION).userAgent("Mozilla").get(); 
Elements link = doc.select(".s-result-list-parent-container > ul > li .s-access-title"); 

をしかし、私はdon'著者を抽出する方法を知っている。何か案は? ありがとうございます。あなたが質問に提供リンクに続き

+2

は、あなたがこのセレクタでみてくださいでした左グリッドインナー.a-row.a-spacing-none .a-size-small.a-color-secondary .a-link-normal.a-text-normal "? – P3trur0

+0

ありがとうございます。 が別のページをどのように通過するかについてご意見はありますか? –

+0

セレクタとして#pagnNextLinkを使用して次のページリンクを取得できると思います。 – P3trur0

答えて

2

、あなたのスクレイピングのニーズのための有効なDOMセレクタは:「.A-固定左グリッドを.A-、固定:

.a-fixed-left-grid .a-fixed-left-grid-inner .a-row.a-spacing-none .a-size-small.a-color-secondary .a-link-normal.a-text-normal 
関連する問題