String strLine = "";
try
{
BufferedReader b = new BufferedReader(new FileReader("html.txt"));
strLine = b.readLine();
} catch(Exception e)
{
e.printStackTrace();
}
String[] temp = strLine.split("<");
temp = temp[1].split(">");
String temp1 = ("<"+temp[0]+">");
strLine = strLine.replaceFirst(temp1,"");
System.out.println(strLine);
は基本的に私は、しかしJavaがあれば、これまで私のコードのみ機能
<span title="Representation in the International Phonetic Alphabet (IPA)" class="IPA">no'b?l</span>
を含むファイルからからこの文字列
<span title="Representation in the International Phonetic Alphabet (IPA)" class="IPA">
を削除したい引用符が含まれるサブストリングを削除します文字列に引用符は含まれません。どうすればこの問題を解決できますか。私は使用しようとしました
.replaceAll("\\\"","\\\\\"");
まだ失敗しました。
すべてのヘルプまたは情報は、大いに評価されます。
HTMLパーサーを使用する必要があります。 – SLaks
はい、これは私が最終的に望むものです。このコードは引用符なしでうまく動作します。 – Jake
http://stackoverflow.com/questions/240546/removing-html-from-a-java-stringを参照してください。それは本当にシンプルです – itsadok