私は学校のプロジェクト私はあなたの教授は、彼/彼女が本当に求めているのか分からないと思うすべての
まずに取り組んでいます....
簡単な方法は、次のようになります。
A)を使用しWebClient、HttpWebRequest又はHttpClientクラスはタグa
、img
、script
からHtmlAgilityPackとエキスリンクで、元のために、htmlコード
B)でHTMLを解析をダウンロードするには、link
など(Regexが...)これには適していません
しかし、動的にjavascriptのPLUS絶対的なものへの相対URLマッピングによって作成されたリンクを欠場するこのアプローチはお尻の痛みです。
別の方法が使用されるだろう(実際のブラウザのエミュレータのを書いて、あなたのコースの外です) Webbrowser control
およびFiddlerCore
ライブラリで、それによって行われた要求を見て...
しかし、この場合には、私はこのアプローチはあなたには、いくつかのサードパーティのライブラリに
PS1を使用するよりも、他の何かを学ぶようになりますどのように表示されません:ページをWebbrowser control
にロードすると、解析するDOMオブジェクトを使用することも解決策ではありません。 Javascriptコードは、ページが読み込まれた後にいくつかのリンクを追加/削除または変更することがあります。だから、この質問はもっと広いです。
PS2:私はそれについてのあなたの教授の答えについての好奇心....
答えは「イエス」です:プログラムであなたが好きな言語でそれを管理する方法があります。あなたが対処する特定の問題を投稿しない限り、誰もあなたのためにコードを書くつもりはありません。 – Matt
BTW: 'そのウェブサイトによって作られたすべてのGETリクエストをダウンロードします.' **あなたがクライアントとして**あなた**のリクエストをお願いします。 –
[保存ページ](http:// www.makeuseof.com/tag/save-complete-webpage-offline-reading/)chromeの機能ですか? – Gumbo