2011-06-25 7 views
0

私は組み込みシステム向けにCGIを構築しており、システム情報をWebページに挿入する機能が必要です。 私の計画は、ソースxhtmlに挿入して、FunctionCallの "マクロ"が見えるときにcgiにその魔法をさせることです。 メモリ内の完全なソースxhtmlを保持して正規表現を行うことができますが、読んでいる間にメモリを少なくしてストリームやチャンクを処理できたら、これを処理するのに問題はありません。 問題は次のとおりです。 ""真ん中でチャンクされていないか、または正規表現が機能しないことを確認する必要があります。 regexには良い選択肢がありますか、それとも助けるかもしれない考えがありますか?準備中(x)ストリームから読んでいるときにhtml

+0

あなたはどの言語を使用していますか? –

答えて

0

(X)HTMLは「通常の」言語ではないため、regexの代替手段が必要です。

あなたがHTML :: Parserののサブクラスの1のようなものの恩恵を受ける可能性がある

:HTML :: TokeParser、HTML :: TokeParser :: Simpleは、HTML :: TreeBuilder(::のXpath)?, HTML :: TableExtractなど

関連する問題