2011-08-07 14 views
0

可能性の重複:
Fast, lightweight HTML parser for C++HTMLをすばやく解析する最適な方法は何ですか?

私は、文字列で、ウェブサイトの内容を持っていると私はデータの約10枚を解析したいと思います。これを達成する簡単な方法は何ですか?&?

このタスクで正規表現を使用することは適切ではなく、何らかの種類のXMLパーサーを使用する必要があると聞いています。誰もがお勧めするものはありますか?

+0

少し詳細を追加できますか?必要なデータは何ですか?ページはどのように見えますか? –

+0

このサイトに掲載されているこの質問を参照してください:http://stackoverflow.com/questions/489522/library-recommendation-c-html-parser – Griffin

+0

Dublicate? http://stackoverflow.com/questions/489522/library-recommendation-c-html-parser、正しい答えは "C++を使わないでください" –

答えて

4

専用のHTMLパーサを入手する必要があります。一般的なケースでは、XMLパーサーも正規表現も使用できません。世界で最もメンテナンスが困難なコードが必要な場合は、正規表現を使用して非常に特定のデータを抽出することができます。

+0

良いアプローチについては、(c#)[HTML agility pack](http://htmlagilitypack.codeplex.com/)をご覧ください。これは.NETで広く使用されているトークナイザ/パーサーです。 – Oded

関連する問題