2010-12-10 23 views
0

正規表現パターンを使用しています。文字列の先頭がHTMLの単純なテキストであることを確認し、その文字列を返す必要があります。だから、例えば:Javaの正規表現パターン

Hello World!<TAG> &nsbp; 

は返す必要があります。

Hello World!

+0

HTMLを解析する場合は、HTMLパーサーを使用する必要があります。 –

+0

http://stackoverflow.com/questions/701166/can-you-provide-some-examples-of-why-it-is-hard-to-parse-xml-and-html-with-a-rege –

+0

" split "は最初の引数として正規表現をとります – thejh

答えて

3

大量のテキストまたはファイル全体を解析する場合、文字列を新しい参照に強制する必要があります。そうしないと、部分文字列によるメモリリークが発生する可能性があります。

new String("Hello World!<TAG> &nsbp;".split("<")[0]) 
+0

応答のためのTHanksですが、私はRegexの式を使用する必要があります –

+0

String.splitのAPIをチェックすると、技術的には正規表現です:) –

0
"Hello World!<TAG> &nsbp;".split("<")[0] 

Hello World!を返す必要があります。