2017-09-20 10 views
1

私はspark-cassandra-connector_2.11(バージョン2.0.5)を使用して、CassandraからSparkクラスタにデータをロードしています。私は次のようにデータをロードするためのAPIを読んで使用しています:細かい作業Datastax spark-cassandra-connectorを使用してCassandraテーブルから特定の列を読み取るにはどうすればよいですか?

SparkUtil.initSpark() 
     .read 
     .format("org.apache.spark.sql.cassandra") 
     .options(Map("table"-><table_name>, "keyspace"-><keyspace>)) 
     .load() 

ITSは、しかし、ユースケースの一つに私はカサンドラからのみ特定の列を読みたいです。どのように同じを行うには、読み取りAPIを使用するには?

答えて

2
SparkUtil.initSpark() 
     .read 
     .format("org.apache.spark.sql.cassandra") 
     .options(Map("table"-><table_name>, "keyspace"-><keyspace>)) 
     .load() 
     .select("column_name") 

使用select ..あなたも

1

その他の方法は、オプションのAPIを使用せずに、次の方法を使用することであるケースクラスを使用することができます。

SparkUtil.initSpark() 
     .sparkContext 
     .cassandraTable(<keyspace>, <table_name>) 
     .select(<column_name>) 
関連する問題