私はウェブサイトのHTMLを掻きたい。ブラウザでこのウェブサイトにアクセスすると(ChromeやFireFoxのいずれであっても)、ウェブサイト+ HTMLには問題ありません。リダイレクトされずにHTMLページを取得する方法は?
HttpWebRequest
とHtmlAgilityPack
のようなメソッドを使用してC#でHTMLを解析しようとすると、Webサイトが別のWebサイトにリダイレクトされるため、リダイレクトされたWebサイトのHTMLを解析します。
どのようにこの問題を解決するためのアイデアですか?
サイトは自分のプログラムをプログラムとして認識してすぐにリダイレクトすると思ったので、SeleniumとGoogleDriverとFireFoxDriverを使ってみましたが、運がないとすぐにリダイレクトされました。
ウェブサイト:https://www.jodel.city/7700#!home
private void bt_load_Click(object sender, EventArgs e)
{
var url = @"https://www.jodel.city/7700#!home";
var req = (HttpWebRequest)WebRequest.Create(url);
req.AllowAutoRedirect = false;
// req.Referer = "http://www.muenchen.de/";
var resp = req.GetResponse();
StreamReader sr = new StreamReader(resp.GetResponseStream());
String returnedContent = sr.ReadToEnd();
Console.WriteLine(returnedContent);
return;
}
誰もあなたにアクセスできない場合、その背後には何がありますか?ドイツのIPだけか何か? –