2012-03-10 4 views
1

私は何度も何度も何度も何度も繰り返し見てきました。Stack Overflowでは、正規表現はXHTMLには適していません。しかし私が見たことがないのは代替手段です。HTMLの正規表現に代わるもの

ほとんどのテキストエディタには、RegEx検索と置換が組み込まれており、使いやすいものです。まあ、それはHTMLでうまく動作しないという事実を除いて。 XHTMLの代わりにを解析するためのツールや言語がありますか? 「DIVの中にある「引用」のクラスを持つ段落タグをすべて「monkey」のクラスで検索し、「Monkey Quote」というH2タグを内部に追加するといいでしょう。

解決策を見つけるのに苦労しているもう1つの例は、段落タグ内のすべての単語を見つけて、それらの周りにSPANタグをラップすることです(ワード単位のハイライトオーディオ用)。

この種のもののために意味されるツールや言語?

+0

「各単語の周りに「」をラップする」では、JavaScriptで動的に行うほうがよいでしょう。あなたのマークアップをきれいに保つ。 – Ryan

+0

これまでにJavaScriptを提案した人はいませんか? –

+3

はい、HTML/XMLパーサーと呼ばれています。あなたが使用している言語/プラットフォームに応じて、そこには多くの人がいます。 SOの 'LanguageX HTML parser'を検索してください。例えば、http://stackoverflow.com/questions/3577641/how-to-parse-and-process-html-with-php – Qtax

答えて

3

あなたの最後のコメントから、私はあなたが、コマンドラインから有用な何かをしたいと思いますと仮定しています。

そうであれば、かなりよくここで答え:あなたがよく形成された文書を持っている場合は、XSLTXPATHはあなたが必要なものを行うことができます

Grep and Sed Equivalent for XML Command Line Processing

+0

役に立つと思われます。そこからXSLTとXPATHも使用できます。ありがとうございました。 – Arktype

3

関連する問題