Javaの正規表現パターン

正規表現パターンを使用しています。文字列の先頭がHTMLの単純なテキストであることを確認し、その文字列を返す必要があります。だから、例えば：Javaの正規表現パターン

Hello World!<TAG> &nsbp;

は返す必要があります。

Hello World!

HTMLを解析する場合は、HTMLパーサーを使用する必要があります。 –

http://stackoverflow.com/questions/701166/can-you-provide-some-examples-of-why-it-is-hard-to-parse-xml-and-html-with-a-rege –

" split "は最初の引数として正規表現をとります – thejh

大量のテキストまたはファイル全体を解析する場合、文字列を新しい参照に強制する必要があります。そうしないと、部分文字列によるメモリリークが発生する可能性があります。

new String("Hello World!<TAG> &nsbp;".split("<")[0])

2010-12-11 00:34:14

応答のためのTHanksですが、私はRegexの式を使用する必要があります –

String.splitのAPIをチェックすると、技術的には正規表現です:) –

"Hello World!<TAG> &nsbp;".split("<")[0]

をHello World!を返す必要があります。

2010-12-10 23:51:21 thejh

答えて