2016-04-02 5 views
0

紺碧のpythonで書かれたバッチジョブを提出する方法。私はこれに似ていますが、JavaではなくPythonで探しています。紺碧のpythonで書かれたバッチジョブを提出

curl -k --user "admin:mypassword1!" -v -H 'Content-Type: application/json' -X POST -d '{ "file":"wasb://[email protected]/data/SparkSimpleTest.jar", "className":"com.microsoft.spark.test.SimpleFile" }' "https://mysparkcluster.azurehdinsight.net/livy/batches" 

答えて

0

JavaとPythonのMapReduceジョブは異なります。

Java MapReduceプログラムは、ジョブがHadoop上で直接実行されるため、jarファイルをパッケージ化しました。

しかし、PythonのMapReduceのジョブがSTDINSTDOUT経由でのHadoopストリーミングで実行されている2つのファイルmapper.pyreducer.pyに分離しました。

文書http://www.michael-noll.com/tutorials/writing-an-hadoop-mapreduce-program-in-python/を参照して、マッパー&レデューサーpythonスクリプトをHDInsightにアップロードしてから、Hadoopで実行するジョブとしてシェルスクリプトを作成してください。

関連する問題