2012-02-21 11 views
0

私はWebページの最終的なソースを取得しようとしています。 webclientのopenReadメソッドを使用していますが、このメソッドは最初のページソースのみを返します。ソースがダウンロードされた後、必要なデータを実行して収集するjavascriptがあり、私のメソッドは完全に変更されたものを探します。 私はまさに違いのようなものについて話しています:asp.net C#Webページの最終ページソースを取得

  1. Webページ上で右クリック - > [表示ソース
  2. アクセス開発ツールこのサイトで

ルックは何を知っています私は話している:http://www.augsburg.edu/history/fac_listing.htmlと各オプションを使用してどのように電子メールが表示されるか見る。私は、最初にページの最初の負荷が表示されるということが起こっていると思います。 2番目は最終ページhtmlを表示します。 Webクライアントでは、オプション1を実行できます。

ここではオプション#1のみを返すコードです。ああ、私はコンソールアプリケーションからこれを行う必要があります。ありがとうございました!

private static string GetReader(string site) 
{ 
    WebClient client = new WebClient(); 
    try 
    { 
     data = client.OpenRead(site); 
     reader = new StreamReader(data); 
    } 
    catch 
    { 
     return ""; 
    } 
    return reader.ReadToEnd(); 
} 
+0

user1019042:私も同じ問題を抱えています。あなたが投稿したこの要件のための解決策を得たか教えてください。私は同じHttpWebrequestとHttpResponseを使用しています.http://stackoverflow.com/questions/13666087/getting-page-source-of-web-pages-which-fire-ajax-request-to-server-after-first- l –

答えて

0

私は私の問題の解決策を見つけました。 Selenium-WebDriver PageSourceプロパティを使用してしまいました。それは美しく働いた!

SeleniumとWebdriverについて学んでください。それは簡単に学ぶことです。それはテストのために役立ちます!

関連する問題