JavaでPattern
を作成して文書の行を分割しようとしています。 WordCountの例のデフォルトのPattern
は、"\\s*\\b\\s*"
のようなものです。 しかし、このパターンの問題は、すべての単語を1つの単語に分割することです。一方、私は(私はあなた、それは一緒です。Regexがすべての単語を捕まえ、Javaの "私はあなただよ"
Pattern BOUNDARY = "[a-zA-Z]+'{0,1}[a-zA-Z]*"
String test = "Hello i'm @£[email protected] @@can !!be.
と
for(String word : BOUNDARY.split(test){
println(word)}
を実行して、私は何の結果を得るません:これまでのところ、私が試したことは[a-zA-Z]+'{0,1}[a-zA-Z]*
で、
問題は、私は例えばテスト文字列を、持っているときということです。理想的には、私が手に入れたい
Hello
i'm
you
can
be
アイデアは大歓迎です。 regex101.comでは、私は正規表現を魅力的なものにしていますので、私はJavaの部分で何か誤解していると思います。
*一致する*正規表現で、重複していないすべてのオカレンスを取得するには 'Matcher.find()'を使用してください。 –