私はwww.mediafire.comからダウンロードページを解析しようとしているを使用してWebページをダウンロードし、私はHtmlDocument
にページをロードしようとすると、私は本当に多くの場合、次のメッセージとSystem.Net.WebException
を得るとき:HTTPプロトコル違反HtmlAgilityPack
サーバーがプロトコル 違反をコミットしました。セクション= ResponseStatusLine
これは私のコードです:
HtmlAgilityPack.HtmlWeb web = new HtmlAgilityPack.HtmlWeb();
HtmlAgilityPack.HtmlDocument doc = null;
string url = www.mediafire.com/?abcdefghijkl //There are many different links
try
{
doc = web.Load(url); //From 30 links, usually only 10 load properly
}
catch (WebException)
{
}
任意のアイデア理由だけで10 30のリンク作業(私のプログラムは、「検索エンジン」であるため、リンクは、毎回の変更)とどのように私ができます問題を解決しますか?
ブラウザでこれらのサイトを読み込むと、すべて正常に動作します。
私はApp.configファイルに次の行を追加しようとしましたが、それは
<system.net>
<settings>
<httpWebRequest useUnsafeHeaderParsing="true" />
</settings>
</system.net>
をオーバーライド
。あなたは 'WebRequest'を使ってあなたのブラウザに似たリクエストを作成することができます。 – alexn
多分もっと詳しいことを教えてもらえますか?チュートリアルや何かへのリンクでしょうか? – Flagbug