2016-09-10 16 views
1

私はこの画像では、Javaを使用してリンクを取得したい、画像は以下のとおりです。そのウェブページにはさらにいくつかのリンクがあります。私はstackoverflow上でこのコードを見つけた、私はそれを使用する方法を理解していない。[JAVA]ウェブページからのHTMLリンクを取得

import org.jsoup.Jsoup; 
import org.jsoup.nodes.Document; 
import org.jsoup.nodes.Element; 
import org.jsoup.select.Elements; 

public class weber{ 
    public static void main(String[] args)throws Exception{ 
     String url = "http://www.skyovnis.com/category/ufology/"; 
     Document doc = Jsoup.connect(url).get(); 

     /*String question = doc.select("#site-inner").text(); 
     System.out.println("Question: " + question);*/ 

     Elements anser = doc.select("#container .entry-title a"); 
     for (Element anse : anser){ 
      System.out.println("Answer: " + anse.text()); 
     } 
    } 
} 

コードはオリジナルから編集されています。助けてください。

image

答えて

1

次のURLのコードは問題なく動作します。

public static void main(String[] args) { 

    Document doc; 
    try { 

     // need http protocol 
     doc = Jsoup.connect("http://www.skyovnis.com/category/ufology/").userAgent("Mozilla").get(); 
     // get page title 
     String title = doc.title(); 
     System.out.println("title : " + title); 

     // get all links (this is what you want) 
     Elements links = doc.select("a[href]"); 
     for (Element link : links) { 

      // get the value from href attribute 
      System.out.println("\nlink : " + link.attr("href")); 
      System.out.println("text : " + link.text()); 

     } 

    } catch (IOException e) { 
     e.printStackTrace(); 
    } 

    } 

出力は、コードフィルタ、それをテキストによるリンク後

title : Ufology 

link : http://www.shop.skyovnis.com/ 
text : Shop 

link : http://www.shop.skyovnis.com/product-category/books/ 
text : Books 

ました。

 for (Element link : links) { 



      if(link.text().contains("Arecibo Message"))//find the link with some texts 
      { 
       System.out.println("here is the element you need"); 
       System.out.println("\nlink : " + link.attr("href")); 
       System.out.println("text : " + link.text()); 
      } 


     } 

HTTP 403エラーメッセージを避けるため、Jsoupには「userAgent」を指定することをお勧めします。

ドキュメントdoc = Jsoup.connect( "http://anyurl.com").userAgent( "Mozilla")。get();

「オンナ・マリ・メイデン・ユースカマ・カラ」

refernce:

https://www.mkyong.com/java/jsoup-html-parser-hello-world-examples/

+0

おかげでたくさんのMCN。 – Aimkiller

関連する問題