私はCassandraのテーブルで簡単な計算をするためにsparkを使用しようとしていますが、かなり失われています。Cassandra pythonの設定でスパークする
私は従うことをしようとしています:
./bin/pyspark \
--packages com.datastax.spark:spark-cassandra-connector_2.11:2.0.0-M3
でしかし、私は、ここから物事を設定する方法を確認していない:https://github.com/datastax/spark-cassandra-connector/blob/master/doc/15_python.md
は、だから私はPySparkシェルを実行していますよ。私のカサンドラクラスターの場所をスパークに知らせるにはどうすればいいですか?私はCassandraSQLContext
がこれに使用できることを見てきましたが、私はこれも非難されていると読んでいます。 How to connect spark with cassandra using spark-cassandra-connector?
をしかし、私は
import com.datastax.spark.connector._
を使用する場合Pythonはそれがモジュールを見つけることができないことを言う:
私はこれを読んだことがあります。 誰かが正しく設定する方法について正しい方向に私を指摘することはできますか?