2012-05-04 18 views
4

jsoupを使用してこのウェブページからすべての画像URLを抽出しようとしていますか?それを行う方法について誰でも助けてもらえますか?すべてのタグは、次のようにフォーマットされていますが、私だけではなく、ajaxsrcをSRCの画像を必要とする: http://www.ncataggies.com/PhotoAlbum.dbml?DB_OEM_ID=24500&PALBID=417884JSoupを使用して画像を抽出

これは形式です:リンク

ここ
<IMG ajaxsrc="/pics32/160/MP/MPYXBXTSYVKAKJQ.20110918032436.jpg" src="http://image.cdnllnwnl.xosnetwork.com/pics32/160/MP/MPYXBXTSYVKAKJQ.20110918032436.jpg"> 

のですか?

 Document doc = null; 
    try { 
     doc = Jsoup.connect(articleLink).timeout(10000).get(); 
    } catch (IOException ioe) { 
     return null; 
    } 
    Element content = doc.getElementById("div.thumb-image preview"); 
    Elements links = content.getElementsByAttribute("IMG"); 
    for (Element link : links) { 
     String source = link.attr("src"); 
     Elements imageLinks = link.getElementsByAttribute(source); 
     for(Element imageLink: imageLinks){ 
      //imageLink = picture link? 
     } 

} 

これはそうではありません。私は自分のコードにprintステートメントを持っており、ヒットしません。

答えて

0

すでにこのIMGに応じた要素を持っていると仮定すると、この試してみてください。

文字列のソース= img.attr(「SRC」)を、このattrの方法は、Nodeクラスから

HTH

+0

よく、正確ではありません。私はimgタグのフォーマットを知っていますが、divタグにネストされています。だから私はそれを抜き出す方法を知らない。 –

+0

その場合、divをElementオブジェクトに置き、getElementsByAttribute( "src")を呼び出して、それらのIMG要素の配列を返す必要があります。 – PedroSena

+0

あなたは私に例を挙げることができます、私はあなたが何を言っているかを視覚化しようとしています –

12

継承されている

あなたはすべてのimgタグを取得するには、このような何かを行うことができる必要があります:

for (Element e : doc.select("img")) { 
    System.out.println(e.attr("src")); 
} 

これは、すべてのimgタグを選択すべきであり、 src属性を取得してコンソールに出力します。

0
Document document = Jsoup.connect(" http://www.ncataggies.com/PhotoAlbum.dbml?DB_OEM_ID=24500&PALBID=417884").get(); 

     Elements elements =document.getElementsByTag("IMG"); 
     for(int i=0;i<elements.size();i++) 
     { 
      System.out.println("Sources of "+ i +":"+elements.get(i).attr("src")); 
     } 
関連する問題