3
スカラを使って共存語を計算したい。 しかし、私はいくつかの問題に遭遇します。スカラを使ってsparkを使って共起項を計算する
これは私のコードです:
val path = "pg100.txt"
val words = sc.textFile(path).map(_.toLowerCase.split("[\\s*$&#/\"'\\,.:;?!\\[\\](){}<>~\\-_]+").map(_.trim).sorted)
val coTerm = words.map{ line =>
for{
i <-0 until line.length
j <- (i+1) until line.length
} {
((line(i), line(j)), 1)
}}
予想される出力は次のようになります。
coTerm.collect
res48: Array[Unit] = Array(((word1, word2), 1), ((word1, word3), 1), ((word2, word3), 1)...
しかし、私の出力は以下の通りです:
coTerm.collect
res51: Array[Unit] = Array((),(),(),(),(),(),(),(),(),(),(),(),(),(),(),(),(),(),(),(),()....
なぜ私ができる私にはわかりません.mapのprintln関数を使用して単語のペアを出力しますが、出力は出せません。
おかげで、それは働きます! – Chenson