xmlドキュメントからすべてのxmlタグを削除する必要がありますが、テキストコンテンツは次のように同じオフセットにとどまるXMLで。これはJavaで行う必要があり、私はRegExpが行く方法だと思ったが、私の正規表現にマッチするタグの長さを取得する簡単な方法がないことが分かった。RegExpを使用してXMLタグを空白(タグの長さ)に置き換えます
基本的に私が欲しいものはこれです:
Pattern p = Pattern.compile("<[^>]+>[^<]*]+>");
Matcher m = p.matcher(stringWithXMLContent);
String strippedContent = m.replaceAll("THIS IS A STRING OF WHITESPACES IN THE LENGTH OF THE MATCHED TAG");
は、誰かが私には簡単な方法でこれを行うために役立つことを願って!
なぜ、オハイオ州、なぜ、正規表現は文字と関係があるすべての解決策だと誰もが考えているのですか? : – Bombe
ほとんどの時間はそうだからね;;) – jhoff