Java - Jsoup HTTPエラーがURLを取得しています

私はjsoup/javaを使用して、ユーザーが入力した件名に基づいてGoogleニュース記事にアクセスしようとしていますが、Googleニュースウェブページにアクセスしようとすると、このライン：Java - Jsoup HTTPエラーがURLを取得しています

try { 
doc = (org.jsoup.nodes.Document) Jsoup.connect("https://www.google.com/search?hl=en&gl=us&tbm=nws&authuser=0&q="+ "technology").get(); 
         } catch (IOException e1) { 
          // TODO Auto-generated catch block 
          e1.printStackTrace(); 
         }

私はこのコードを実行すると、私はこのエラーを取得する：私はグーグルにlinkを入力すると

org.jsoup.HttpStatusException: HTTP error fetching URL. Status=403, URL=https://www.google.com/search?hl=en&gl=us&tbm=nws&authuser=0&q=technology 
at org.jsoup.helper.HttpConnection$Response.execute(HttpConnection.java:590) 
at org.jsoup.helper.HttpConnection$Response.execute(HttpConnection.java:540) 
at org.jsoup.helper.HttpConnection.execute(HttpConnection.java:227) 
at org.jsoup.helper.HttpConnection.get(HttpConnection.java:216) 
at newsbot.NewsBot.onUpdateReceived(NewsBot.java:93) 
at org.telegram.telegrambots.updatesreceivers.BotSession$HandlerThread.run(BotSession.java:197)

はしかし、私はアセスしたいWebページが完全にapears。本当にありがとうございます。

出典

2016-09-18 Stephane Hatgis-Kessell

を含めることができます。詳細なログを表示するには、net.debug = allを使用します。それはそれをデバッグするのに役立ちます。 –

あなたはユーザーエージェントを含める必要があります。

Jsoup.connect("https://www.google.com/search?hl=en&gl=us&tbm=nws&authuser=0&q="+ "technology") 
    .userAgent("blah-blah") 
    .get();

出典

2016-09-18 15:16:22

あなたは-Djavaxを追加することができ、ユーザエージェント、ページが禁止されることはありませんその方法（HTTP 403）

Document doc = (Document) Jsoup 
       .connect("https://www.google.com/search?hl=en&gl=us&tbm=nws&authuser=0&q=" + "technology") 
       .ignoreContentType(true) 
       .userAgent("Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:25.0) Gecko/20100101 Firefox/25.0").get(); 
     System.out.println(doc);

出典

2016-09-18 15:26:36

Java - Jsoup HTTPエラーがURLを取得しています

答えて

関連する問題