私はAmazonのカテゴリをクロールしており、salesrankと製品URLを取得しています。今はカテゴリをクロールしたいので、カテゴリのスパンからすべての情報を取得します。WebクローラAmazon get span-Element
<span class="zg_hrsr_ladder">in <a href="https://www.amazon.de/gp/bestsellers/books/ref=pd_zg_hrsr_b_1_1">Bücher</a> > <a href="https://www.amazon.de/gp/bestsellers/books/287480/ref=pd_zg_hrsr_b_1_2">Krimis & Thriller</a> > <b><a href="https://www.amazon.de/gp/bestsellers/books/419954031/ref=pd_zg_hrsr_b_1_3_last">Deutschland</a></b></span>
これは例のコードスニペットで、コード
Elements category = htmlDocument.select("span.zg_hrsr_ladder");
次に私はスパン内のすべてを取得。しかし、私はhref "Bücher" "Krimis &スリラー"と "Deutschland"の中のテキストのみを必要とします。この情報はどのように入手できますか?
、代わりにAPIを使用して... http://docs.developer.amazonservices.com/en_US/products /index.html – baao