DatastaxとSparkを使用してCassandraテーブルの特定の列(列「a」)の値とカウントのリストを取得したいが、実行する正しい方法を決定できないその要求。私は基本的に同等のものをやろうとしているApache Spark Count by Groupメソッド
私はこれは私を与えることになりますカサンドラ
import com.datastax.spark.connector._
import org.apache.spark.sql.cassandra._
val rdd = sc.cassandraTable("mykeyspace", "mytable").select("a")
rdd.groupBy(row => row.getString("a")).count()
にdatastaxと火花を使用して、次の試してみた
SELECT a, COUNT(a)
FROM mytable
T-SQL a列の個別の値の数ですが、値のリストとその値の数の後にはもっと多くなりました(val1:10 ... val2:5 ... val3:12 ...など)。私はいくつかの.collectなどを試してきましたが、リストをそこに取得する方法がわかりません、どんな助けもありがとうございます。