フレーズと大文字と小文字を区別する検索をサポートするJavaのHTMLパーサーがあるかどうかを知りたいと思います。 私が知る必要があるのは、検索されたフレーズと大文字と小文字の区別のサポートのためのhtmlページのヒット数です。フレーズと大文字と小文字を区別する検索のためのHTMLパーサー
おかげで、 シャルマ
フレーズと大文字と小文字を区別する検索をサポートするJavaのHTMLパーサーがあるかどうかを知りたいと思います。 私が知る必要があるのは、検索されたフレーズと大文字と小文字の区別のサポートのためのhtmlページのヒット数です。フレーズと大文字と小文字を区別する検索のためのHTMLパーサー
おかげで、 シャルマ
は、それは、助けにはならない:
String noHTMLString = htmlString.replaceAll("\\<.*?\\>", "");
、今countあなたがnoHTMLStringに必要なもの?
this is <span>cool</span>
、あなたは(前のhtmlページは、「このクールである」という文字列に変換されるので)「クール」のテキストを探すために必要があります:あなたのようなマークアップとHTMLページを持っている場合は、有用である可能性があります。あなたはApache Commons LangからStringUtilsを使用することができますをカウントするには、countMatchesと呼ばれる特別な方法があります。一緒にすべて一緒に働く必要があります:
String htmlString = "this is <span>cool</span>";
String noHTMLString = htmlString.replaceAll("\\<.*?\\>", "");
int count = StringUtils.countMatches(noHTMLString, "is cool");
私は、少なくともそれを試してみましょう。それは、HTMLを解析し、それからあなたが必要とする言葉を探してそれをトラバースするよりよく聞こえる...
お願い、それはJava、ないJAVA –
@Sean申し訳ありませんが、私はJavaでなければならないことを知っています、何か特別な理由はありますか? – remo
という名前なので、頭字語/省略形ではありません(PERLとは対照的に)。 –