初めてのコーディングはJavaですので、私と同行してください:PIは、HTMLファイルを開き、すべてを削除するようにプログラムをJavaで作成しようとしています。そのhtmlタグが、それだけで、他のすべてではありません。私はファイルがすでに存在していると仮定しており、作成する必要はありません。 今のところ私はより速く始めるために、HTMLコードを含む.txtファイルを使って作業しています。 これまでのところ、ファイルを編集してhtmlタグを削除し、何も置き換えないようにしました。しかし、私が本当に望むのは、開口部と閉じ括弧の内側にあるものをすべて取り除くことです。私は私が必要なものの例が表示されます:私のプログラムが実行された後文字列中の文字列のうち、Javaの他の2文字間にあるすべての文字を置き換えます。
<html>
<body>
<p> blah blah blah
</p>
</body>
</html>
を、txtファイルは、それだけ「何とか何とか何とか」を持っている必要があります。タグを置き換えるために は、私が使用しています:
if(myString.contains("<html>"))
{
// do stuff
}
をだからここに私の質問です:
if(myString.contains("<") && it is followed by as many characters as the file wants by (">"))
//then remove everything in between them.
期すために:私は言うことを可能にするJavaでのエスケープ文字のようなものがあります.txtファイル内のHTMLコードにエラーがないと仮定できます。あなたが私に欲しいと思ったらコードを掲示しますが、それは本当に構造化されていないので、皆さんが私が何をやっているのかを理解するのに役立つとは思いません。それは、私が同時にたくさんのことを試していて、私がコメントとして役に立つかもしれないものを何でも残しているからです。あなたの時間をありがとう!
[JavaでのHTMLタグの削除](http://stackoverflow.com/questions/832620/stripping-html-tags-in-java) – nvisser