を使用して単語を分割する私は、このようなテキストファイルがあるとします。スカラ:どのように複数の区切り文字
Apple#mango&[email protected]
データはワードカウントを実行する前に、複数の区切り文字で分割する必要があります。
どうすればよいですか?
を使用して単語を分割する私は、このようなテキストファイルがあるとします。スカラ:どのように複数の区切り文字
Apple#mango&[email protected]
データはワードカウントを実行する前に、複数の区切り文字で分割する必要があります。
どうすればよいですか?
使用split
方法:
scala> "Apple#mango&[email protected]".split("[#&@]")
res0: Array[String] = Array(Apple, mango, banana, grapes)
あなただけの単語をカウントしたい場合は、分割する必要はありません。このような何かを行います。
val numWords = """\b\w""".r.findAllIn(string).length
これは、単語の先頭にマッチする正規表現である(\b
は、\w
は、任意の「単語」の文字(文字、数字、アンダースコア)である、(ゼロ長)ワード境界であります
各単語を別々に数えて複数の行にまたがって表示する場合は、おそらくsplit
が最適なオプションでしょう:
source
.getLines
.flatMap(_.split("\\W+"))
.filterNot(_.isEmpty)
.groupBy(identity)
.mapValues(_.size)
作品です。ありがとうございますオットマン:)))))))))))))))))) –