2017-06-25 28 views
0

私はGoogleの画像で検索ページのソースコードを取得しようとしています。したがって、画像で検索するURLはhttps://www.images.google.com/searchbyimage?image_url=x です。xは画像のURLです。URLで正しいWebページのソースコードを取得できません - c#

私はそのコードを使用しますが、取得するソースコードは特定の検索結果ウェブページのソースコードではなく、Google画像のソースコードです。

public static string GetSourceCode(string url) 
{ 
    HttpWebRequest myRequest = (HttpWebRequest)WebRequest.Create(url); 
    myRequest.Method = "GET"; 
    WebResponse myResponse = myRequest.GetResponse(); 
    StreamReader sr = new StreamReader(myResponse.GetResponseStream(), System.Text.Encoding.UTF8); 
    string result = sr.ReadToEnd(); 
    sr.Close(); 
    myResponse.Close(); 

    return result; 
} 
+0

実際、ロード時に実際にどのページのソースコードを取得するには、JavaScriptを少し実行させる必要があります。 WebClientの専門家ではありませんが、JavaScriptを実行する機能を持っていると思われる投稿があります。それ以外の場合は、仮想ブラウザやSeleniumのようなものがこの場合に動作します。ブラウザーには、確かにページが正常に表示されるようにしてソースコードを提供するために必要な機能があります。 –

答えて

0

Google検索を実行すると、Googleは少しだけHTMLを返します(ブラウザで結果文字列を開くと表示されます)。結果のJavaScriptは、実際の検索結果を読み込むために実行されます。

「ロード」でブレークポイントを設定すると、クロムで(少なくとも実際にテストした場所で)JavaScriptが実行されるのを見ることができます。

関連する問題