問題が発生しました。インポート時にcassandra接続コードのサンプルを書き込むと、エラーが発生する。PysparkとCassandra接続エラー
iは
./spark-submit --jars spark-cassandra-connector_2.11-1.6.0-M1.jar /home/beyhan/sparkCassandra.py
./spark-submit --jars spark-cassandra-connector_2.10-1.6.0.jar /home/beyhan/sparkCassandra.py
(それらの両方がエラーを与えた)次のコードのようなスクリプトを開始するが、私は間違っていた一部
import pyspark_cassandra
ImportError: No module named pyspark_cassandra
中にエラーの下に与えていますか?
注:私はすでにcassandraデータベースをインストールしています。
どこにそのimport文を手に入れたためPySpark with DataFramesマニュアルを参照してくださいから? Cassandraコネクタのドキュメントをお読みください:https://github.com/datastax/spark-cassandra-connector#documentation?そのインポートステートメントはどこにも言及されていません。その名前を持つモジュールが実際には存在しないからです。 – sgvd