-1
可能性の重複:あなたがHTMLを解析するための推薦は何HTMLパーサ
What are the pros and cons of the leading Java HTML parsers?特定のJava HTMLパーサ
? このパーサーは、便利なテキスト、メニュー、フッターなし、ヘッダー情報を返しません。通常のコンテンツを含むテキストのみ。
私はJericho Htmlパーサ、HtmlCleanerを試しましたが、必要に応じて動作しないようです。
ありがとうございます。
私は信じられないパーサーを見つけました。私が探していたものです。 自分自身のオープンソースをチェックすることができます:http://boilerpipe-web.appspot.com/ – Paulius
@Pauliusそれはかなりクールに見えます;ティカのことと似ています。参照ありがとう。 –