2011-11-15 7 views
1

一部のサイトのコンテンツを読み込むためにjsoupパーサーを使用しています。一般に、一部のサイトでは、広告や関連性の低いものがページに表示されます。 URLを解析するときにこれらを無視することはできますか?jsoupを使用してURLからスパム/広告を無視する

答えて

0

いいえ、Jsoupに組み込まれた広告リンク回避機能はありません。手動で行う必要があります(各ページの広告URLを調べて、正規表現と照合するなど)。

0

これはあなたの質問に対する直接の回答ではありませんが、AlchemyAPIを使用することができます。無料の1,000 APIコールプログラム(学術目的の場合は30,000):

関連する問題