私はJAVAのタグの間にテキストを取得しようとします。私は抽出するために正規表現を使用したい正規表現タグ間でテキストを取得
`
<td colspan="2" style="font-weight:bold;">HELLO TOTO</td>
<td>Function :</td>
`
"HELLO TOTO" ではなく "機能:"
私はすでにこの
のようなものを試してみました`
String btwTags = "<td colspan=\"2\" style=\"font-weight:bold;\">HELLO TOTO</td>\n" + "<td>Function :</td>";
Pattern pattern = Pattern.compile("<td(.*?)>(.*?)</td>");
Matcher matcher = pattern.matcher(btwTags);
while (matcher.find()) {
String group = matcher.group();
System.out.println(group);
}
しかし結果は入力と同じです。 アイデア
は、私もこの正規表現(?<=<td>)(.*?)(?=</td>)
を試みたが、それが唯一の難点「機能:」 私は知らないが、彼は事前に
ソースXHTMLですか?もしそうなら、私はXMLパーサとXPATHを使用します。 – Roger
jsoupライブラリを試してください。下記のリンクをご覧ください。 https://jsoup.org/ –
use group(2);タグ内の内容を取得するには – Aelop