は私のようなたとえば、複数の行を含むtest.txtというファイルを持っている:Java文字列は英数字と改行で分割されますか?
"h3llo, @my name is, bob! (how are you?)"
"i am [email protected]@@@@"
私は、出力は次のようになりますので、ArrayListのにすべての英数字と新しい行を分割したい
output = ["h", "llo", "my", "name", "is", "bob", "how", "are", "you", "i", "am", "fine"]
は今のところ、私は
output.split("\\P{Alpha}+")
としかし、これはArrayListの中で最初の場所にコンマを追加しているようだいくつかの理由で私のテキストを分割しようとした、と再改行を空の文字列で置き換えます。
output = ["", "h", "llo", "my", "name", "is", "bob", "how", "are", "you", "", "i", "am", "fine"]
これを修正する別の方法はありますか?ありがとうございました!
-
編集:どのように私はそれが新しい行を無視することを確認することができますか?
英数字またはAlphaだけでしょうか? –
なぜ 'hllo'は出力で1つのトークンであると予想されますが、' 3'は取り除かれますか? –
@sashok_bg英数字 – evelyn