2
私のubuntu 14.04にcassandra 2.1.11、spark 2.0.0.bin hadoop 2.7、java version 1.8.0_101をインストールしました。スパークカサンドラコネクタ、私がインストールされているgitのcassandraとsparkの接続中にエラーが発生しました
sudo apt-get install git
git clone https://github.com/datastax/spark-cassandra-connector.git
し、それを
cd spark-cassandra-connector
git checkout v1.4.0
./sbt/sbt assembly
を構築し、ホームディレクトリ
cp spark-cassandra-connector/target/scala-2.10/spark-cassandra-connector-assembly-1.4.0-SNAPSHOT.jar ~
にスカラ座のjarファイルを配置し、コネクタを使用するために
bin/spark-shell --jars ~/spark-cassandra-connector-assembly-1.4.0-SNAPSHOT.jar
とScalaで、私はcqlshからMY_TABLEテスト鍵空間とテーブルを作成し、接続をテストするために、私は
eval test_spark_rdd = sc.cassandraTable("test", "my_table")
次のコマンドを実行して、持っている
sc.stop
import com.datastax.spark.connector._, org.apache.spark.SparkContext, org.apache.spark.SparkContext._, org.apache.spark.SparkConf
val conf = new SparkConf(true).set("spark.cassandra.connection.host", "localhost")
val sc = new SparkContext(conf)
をPROMTエラー
error: missing or invalid dependency detected while loading class file 'CassandraConnector.class'.
Could not access type Logging in package org.apache.spark,
because it (or its dependencies) are missing. Check your build definition for
missing or conflicting dependencies. (Re-run with `-Ylog-classpath` to see the problematic classpath.)
A full rebuild may help if 'CassandraConnector.class' was compiled against an incompatible version of org.apache.spark.
これはバージョンの不一致によるものですか火花とキャサンドラのh?
私は、火花やカサンドラを接続することができています。今私はpysparkとcassandra、[pyspark_cassandra](http://stackoverflow.com/questions/39437584/connecting-integrating-cassandra-with-pyspark)に接続したいと思います。このjarファイルはどうやって実行できますか? – bikas
"spark-shell"を "pyspark"に置き換えてください。 – RussS