私は糸でpi.pyサンプルを正常に実行することができます:./bin/spark-submit --master yarn --deploy-mode cluster examples/src/main/python/pi.py
。Spark公式のPythonマシンで糸の例を学習できませんでした
しかし、私が./bin/spark-submit --master yarn --deploy-mode cluster examples/src/main/python/ml/logistic_regression_with_elastic_net.py
を実行すると失敗しました。エラーメッセージ:Container exited with a non-zero exit code 1
この2つのファイルを比較すると、from pyspark.ml.classification import LogisticRegression
をpi.py
に追加した後、pi.py
を実行するとエラーが発生しました。
しかし、私はそれを修正する方法がわかりません。私はmlの例を実行すると自分のデータファイルをhdfsにアップロードする必要があるので、--files
を使用しようとしていますが、それは正しいですか?それが正しいとすれば、hdfs上のデータファイルのパスが分からないので、pythonスクリプトはデータファイルを取得できません。 (ファイルがHDFSにアップロードされた後、私はhdfs://master:9000/user/root/.sparkStaging/application_1488329960574_0011/mnist8m_800
すなわち、パスを見ることができるが、手遅れに、私が提出したときに、私はパスを指定することができますか?)
使用しているスパークのバージョンは何ですか? – Mariusz
@Mariusz spark 2.0.2 – YunjieJi