私は、HTML文書PHPのHTMLパーサのパフォーマンス
<input type="hidden" name="email" id="email" value="email%40hotmail.com">
から非表示の入力を抽出する必要があります私は現在http://simplehtmldom.sourceforge.net/を使用していますが、私は下のRAMの使用量を持つ任意の速いソリューションがあるかどうかを知りたいです。入力はドキュメントの途中にありますので、htmlページ全体を読み込む必要はありません。正規表現はより速く動作するでしょうか? 私は数百万のドキュメントに対処する必要があります。はっきりさせるために、私は電子メールのみを抽出する必要があります%40hotmail.com
私は全体の入力ではなく、VALUEだけを取得しようとしています。あなたが私に与えたパターンを印刷すると、[0] =>配列 ( [0] => – Michael
@Michaelあなたはキャプチャしたい部分の周りに括弧を追加します。あなたの答えを修正しました。 – Ariel