2016-04-26 5 views
-1

私はウェブサイトからすべての部門を取得しようとしています。 google.comや別のWebページで試してみると、うまくいきます。ただInstagramは空の結果を返します。メトロは次のようになります:Java Jsoup no instagram.comの結果なし

public static List<String> getPhotoPaths(String url) { 
    List<String> paths = new ArrayList<>(); 

    try { 
     Document doc = Jsoup.connect("https://www.instagram.com/explore/tags/test/") 
       .userAgent("Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/535.2 (KHTML, like Gecko) Chrome/15.0.874.120 Safari/535.2") 
       .get(); 


     for (Element element : doc.select("div")) { 
      System.out.println(element); 
     } 

    } catch (IOException e) { 
     // TODO Auto-generated catch block 
     e.printStackTrace(); 
    } 
    return paths; 

} 

アイデアは何ですか? Thisはテストウェブサイトで、他のすべてのページと同様にnormaly divを使用します。か否か?

+0

が重複する可能性を指し示すURLが含まれているwindow._sharedData変数に割り当てられたJSONオブジェクトを、解析することができます別のライブラリを使用する必要がありますので、Javascriptを扱うことはできませんします。http:/ /stackoverflow.com/questions/7744075/how-to-connect-via-https-using-jsoup –

答えて

0

InstragramはJavascriptのおかげでこれらの画像を非同期に読み込むため、結果は得られません(ブラウザで画像を無効にすると画像は表示されなくなります)ので、ページが読み込まれても使用できません。残念ながらJSoupあなたはそれを扱うか、自分でサムネイルと原画

関連する問題