HTML(XHTML有効)ページからいくつかのコンテンツを取得する必要があります。私はカールを使ってページをつかみ、それをメモリに保存します。Cを使ってhtmlを解析する
私はPCREライブラリでregexを使用するというアイデアを持っていましたが、単にCでそれを使用した例が見つかりませんでした。次に、HTMLパーサーを見てみました。私が見つけたのは、HTMLparserと呼ばれるlibxml用のぎっしりとした文書化されたモジュールでした。
代替手段はありますか?そうでない場合は、私がすでに見つけたものの例?
正規表現でHTMLを解析に対する警告に必須のリンク:http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454 #1732454 – moopet
次のリンクを参照してください。私はWindowsプラットフォーム用のlibxml2 Cライブラリを使用してソリューション全体を書きました。 http://stackoverflow.com/questions/5465965/how-can-libxml2-be-used-to-parse-data-from-xml/38826052#38826052 –