私はWPF、C#、VS2010でアプリケーションを開発していますが、これを進める方法がわかりません...HTML文書を読み込んでイメージ名を抽出するにはどうすればよいですか?
私は、参照されているすべての.jpgと.bmpイメージを取得するアルゴリズムに興味がありますhtmlファイルhtmlファイルから本文を抽出するにはどうすればよいですか?
ありがとうございました
私はWPF、C#、VS2010でアプリケーションを開発していますが、これを進める方法がわかりません...HTML文書を読み込んでイメージ名を抽出するにはどうすればよいですか?
私は、参照されているすべての.jpgと.bmpイメージを取得するアルゴリズムに興味がありますhtmlファイルhtmlファイルから本文を抽出するにはどうすればよいですか?
ありがとうございました
HTML Agility Packは、HTML文書から要素を抽出するためにかなり固体のライブラリです。簡単な見方は、それを良いAPIを使ってXPATH上のラッパーとして見ることです。
正規表現で行うことができます。
http://msdn.microsoft.com/en-us/library/ms228595.aspx
次のパターンが動作するはずです:
(http?:\/\/.*\.(?:png|jpg|gif))