2017-07-11 5 views
1

私はサイトからビデオsrcリンクを取得しようとしています。しかしwebbrowser.documenttextはJavaScriptのレンダリング後にビデオタグに加えられた変更を含まないWebサイトのソースコードのみを取得しました。例えば.Netビデオを取得するタグの後のウェブサイトの属性がjavascriptから変更されています

: ドキュメントのテキストまたは単純なWebクライアントの要求を取得すると、あなたが彼らのvideoタグについて、次のテキストを取得Screenshot from View-Source

ご覧のとおり、それはしかし

<video id="my_play" class="video-js vjs-theme-colors-blue vjs-paused vjs-fluid" controls preload="auto" data-setup='{"techOrder": ["html5", "flash"]}'> 
    <p class="vjs-no-js">To view this video please enable JavaScript, and consider upgrading to a web browser that <a href="http://videojs.com/html5-video-support/" target="_blank">supports HTML5 video</a></p> 
    </video> 

を持っていますあなたは開発ツールを(私は)javascriptによってレンダリングされ、ビデオタグはsrc属性を持つように変更されます。 Screenshot from Dev Tool

2番目のスクリーンショットのハイライトsrc属性は、取得する必要のあるアドレスです。そのリンクを取得する方法に関する提案はありますか?

+1

これについての私のコメントそうな問題のサイトのTOSに違反することは、今どんなあまり関係になっていませんあなたはサイトの名前を空白にしている... –

答えて

0

Gecko browserを使用してサイトを読み込むことができます。 (使用DocumentCompletedイベント)をロード行わサイトたら、src属性を取得するために以下のコードを実行することができ

GeckoHtmlElement ele; 
ele = geckoWebBrowser1.Document.GetHtmlElementById("myData"); 
MessageBox.Show(ele.GetAttribute("Value")); 
関連する問題