私はHueのOozieと一緒にClouderaで動作するSparkアプリ(現在1.6.0)をビルドしています。これらのジョブを実行するユーザーは、OozieのXML設定をハッキングしたり、コマンドラインでspark-submitを起動したりするよりも、ブラウザベースのインターフェースで快適になるため、HueとOozieを使用したいと考えています。Apache Spark on Oozie:余分な設定ファイルを提供していますか?
色相(3.10)で基本的なOozie/Sparkアクションを実行する方法を理解しました。しかし、通常のScalaアプリケーションと同じように、実行時に設定ファイルを介して様々な非Sparkパラメータを提供できるようにしたいと考えています。私は、(a)Oozieが受け入れ、(b)実行時に指定されたファイルから設定パラメータを取り出すことをSparkが認識するという仕組みを見つけるのに苦労しています。
私はさまざまな順列を試みました。フエのOozieアクション「プロパティ」タブでオプションの一つとしてこれを置く:
options "-Dconfig.file=/my/file/location/fubar.conf"
しかし、スパークジョブが設定を拾うことができない、または単に(ログに明らかな誤り)完全に失敗しません。スパーク提出使用して、コマンドラインからローカルモード(すなわちないClouderaの上)にスパークコードを実行
が動作しているようです:
spark-submit --class com.example.Sparky --master local[*] \
--driver-java-options "-Dconfig.file=/my/file/location/fubar.conf" \
target/scala-2.11/spark-dummy_2.11-1.0.jar
だから私は、私は同等のものを提供する方法を見つける必要があると思いますランタイム設定をClouderaのOozie/Spark Actionに追加します。
誰もがこれを行う正しい方法を知っていますか?
申し訳ありません、上記のOozieオプションは実際には "--driver-java-options ..."です。 –