HTMLをすばやく解析する最適な方法は何ですか？

可能性の重複：
Fast, lightweight HTML parser for C++HTMLをすばやく解析する最適な方法は何ですか？

私は、文字列で、ウェブサイトの内容を持っていると私はデータの約10枚を解析したいと思います。これを達成する簡単な方法は何ですか？&？

このタスクで正規表現を使用することは適切ではなく、何らかの種類のXMLパーサーを使用する必要があると聞いています。誰もがお勧めするものはありますか？

2011-08-07 Anonymous

少し詳細を追加できますか？必要なデータは何ですか？ページはどのように見えますか？ –

このサイトに掲載されているこの質問を参照してください：http://stackoverflow.com/questions/489522/library-recommendation-c-html-parser – Griffin

Dublicate？ http://stackoverflow.com/questions/489522/library-recommendation-c-html-parser、正しい答えは "C++を使わないでください" –

専用のHTMLパーサを入手する必要があります。一般的なケースでは、XMLパーサーも正規表現も使用できません。世界で最もメンテナンスが困難なコードが必要な場合は、正規表現を使用して非常に特定のデータを抽出することができます。

2011-08-07 18:57:48 Puppy

良いアプローチについては、（c＃）[HTML agility pack]（http://htmlagilitypack.codeplex.com/）をご覧ください。これは.NETで広く使用されているトークナイザ/パーサーです。 – Oded

答えて