私はregexを使って、Nodejを使って検索したウェブサイトのHTMLコードからテキストを抽出します。私が受け取ったテキストは次のようなものでした:Node.js正規表現を使ってレスポンスから特定の文字列を抽出する
<body>
...
<p>text with certain format that I want.</p>
...
</body>
私はテストをどのように抽出して変数に格納しますか?
私がこれを行う理由は、多数のページから情報を取得する必要があるためです。手動で行うことは不可能です。
大変ありがとうございます!
あなたは、特定の文字列をお探しですか?これらのページに複数の段落がありますか? –
[Cheerio](https://github.com/cheeriojs/cheerio)を使用してください。サーバーサイドのjQueryです。または、[YQL](https://developer.yahoo.com/yql/)を使用することもできます。 – strah
1)重複2)しない3)両方のリンクhttp://stackoverflow.com/a/1732454/1178921 – deltree