2010-11-26 3 views
3

ヘッダーが404に設定されている場合でも、Webページのhtmlを取得する方法はありますか?一部のページにはまだテキストがありますが、私の場合はそのテキストを読む必要があります。ヘッダーがHTTP/1.0に設定されているときにC#でページのHTMLを取得する方法404が見つかりません

HTMLを取得するための例C#コード:あなたは、ヘッダーで見れば、あなたはそれがわかりますhttp://bypass.rd.to/headertest.php

public static string GetHtmlFromUri(string resource) 
     { 
      string html = string.Empty; 
      HttpWebRequest req = (HttpWebRequest)WebRequest.Create(resource); //Errors here. 
      using (HttpWebResponse resp = (HttpWebResponse)req.GetResponse()) 
      { 
       bool isSuccess = (int)resp.StatusCode < 299 && (int)resp.StatusCode >= 200; 
       if (isSuccess) 
       { 
        using (StreamReader reader = new StreamReader(resp.GetResponseStream())) 
        { 
         html = reader.ReadToEnd(); 
        } 
       } 
      } 
      return html; 
     } 

そして、ここでは私が404エラーでこれをテストするために作成したページです404ですが、テキストを読むことができます。今、例外はあなたが戻って送信されたすべてのものにアクセスすることができ、そこからHttpWebResponseが含まれてい

MessageBox.Show(GetHtmlFromUri("http://bypass.rd.to/headertest.php")); 

System.Net.WebException was unhandled
Message="The remote server returned an error: (404) Not Found."
Source="System"
StackTrace: at System.Net.HttpWebRequest.GetResponse()

答えて

4

... C#でページを取得しよう。例については、this answerを参照してください。

関連する問題