2017-07-06 6 views
1

https://medium.com/@faizanahemad/machine-learning-with-jupyter-using-scala-spark-and-python-the-setup-62d05b0c7f56の手順に従ってApache Toreeをインストールしました。Apache toree - pySparkがパッケージをロードしていない

私がカーネルファイルにPYTHONPATH変数を使用してpySparkカーネルのパッケージをインポートするために管理していないが

/usr/local/share/jupyter/kernels/apache_toree_pyspark/kernel.json。

ノートブックを使用すると、sys.pathとos.environ ['PYTHONPATH']に必要な.zipが表示され、関連する.jarはos.environ ['SPARK_CLASSPATH']にありますが、

"graphframeという名前のモジュールはありません":import graphframe。

グラフフレームをインポートする方法についてのご意見はありますか?

ありがとうございます。

答えて

1

私はデータフレームのダウンロードページから.zipを使用していましたが、問題は解決しません。 --packagesパラメータは私のために動作しませんでしたが、Importing PySpark packages:正しい.zipファイルには、次の手順を作成することができます。

https://github.com/graphframes/graphframes/issues/172

別の解決策で与えられました。

このヘルプが必要です。

関連する問題