2009-08-10 12 views
1

私は素早くhtml属性の束を辞書に入れる必要があります。同様にRegexを使ってHtml属性を取得する

<body topmargin=10 leftmargin=0 class="something"> should amount to 

attr["topmargin"]="10" 
attr["leftmargin"]="0" 
attr["class"]="something" 

これはサーバー側で行われ、タグの内容はすでに利用可能です。私は値のないタグを除外し、異なる引用符や欠如を考慮に入れるだけです。

私はregexが採用されるべきだと推測しています。同様の質問がありましたが、本当に私の必要性に合致するものはありません。

おかげ

編集:明確化、サーバー側

答えて

0

私はまた、特殊なパーサを使用して良くなると思いますが、あなたは正規表現を使用したい場合は、何かしてみてください:私はちょうどそれについて何

4

HtmlAgilityPackは?

+0

かなりうまく機能し、それをテストして

\<(?<tag>[a-zA-Z]+)((?<name>\w+)="?(?<value>\w+)"?)*\> 

を?私は良いフレームワークかhtmlパーサがこの1つのタスクのために必要ではありません。私は良い正規表現が解決できると知っています。私はこれらすべての年の後に正規表現でまだ吸う。 – danijels

+0

なぜこれがダウン表示されますか?関連性があり、有用であると思われます。 – djna

+2

@danijels - HMTLを解析するために正規表現を使用することは非常に困難です。この回答を検討することを強くお勧めします。 (途中で+1) –

関連する問題