AWSでセットアップしていないEMRを使用しています。sparkが使用しているpythonインスタンスの中にpysparkモジュールがありません
私はPythonインタプリタの火花が使用していると私は私たちの火花-submitコマンドを実行すると、私の.bashrcに、私は私が道に印刷するsys.executable使用していた次のセットアップexport PYSPARK_PYTHON=/mnt/anaconda/bin/python
を持っているかを理解しようとしていますPythonインタプリタとこれは実際にそのインタプリタを使用しています。
>>> import pyspark
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
ImportError: No module named pyspark
ここで何が起こっている:私はそのフォルダに特異的に行くとき
しかし、私が手を試し、その後./python
でのPythonのインスタンスを起動すると?この通訳は、pysparkモジュールをインストールしてはいけませんか?
あなたの 'PYTHONPATH'環境変数は何ですか? –
@JohnGordon ':/ mnt/anaconda/bin' – timbram
Pythonモジュールが' bin'ディレクトリにインストールされることはほとんどないようです。どのように/どこに 'PYTHONPATH'が設定されていますか? –