azkaban

    0

    1答えて

    ジョブが失敗した後にAzkabanの動作を制御する方法があります 特定のジョブが失敗した場合に特定のことを行うことを意味します ハイブへの負荷が失敗し、 可能ですか? または私が挿入し、パイソン のような失敗を処理する特定のジョブを作成する必要があり、私はこれを処理おかげ

    0

    1答えて

    私はAzkaban 3.4.1を使用していますが、私のフローの1つに30以上の依存関係があります。いくつかの依存関係は、別の依存関係よりも時間がかかります。したがって、私はこれらのフローの優先順位をつけて、別のフローが流れる前に開始したいと考えています。 (実行中のスレッドが制限されているため) 現在のところ、パラレル実行の数はflow.num.job.threads(デフォルトでは10)に制限さ

    0

    1答えて

    ユースケースの代わりに成功、最終的な地位を持っていますジョブの最終ステータスはFAILEDです 実際の結果: HadoopのRMは、ジョブの最終状態が正常であると述べ 誰もがそれを固定することができます方法を知っていますか?

    -1

    1答えて

    spark-submitスクリプトを使用して手動で実行しているSparkストリーミングジョブがあります。私は毎日実行するようにスケジュールしたい。 Azkaban、Airflow、Oozie、Crontab、Spark-jobserver、Quartz、Luigiのどれが良いですか。 ご了承ください。

    0

    2答えて

    私は、私たちのワークフローユースケースの1つとして、AzkabanとApache Activitiを調査しています。私が理解していることは、Azkaban内の各作業が別々のプロセスとして実行されること、Activitiと同じこと、またはActivitiのメインプロセス内でActivitiタスクが別々のスレッドとして実行されることです。

    6

    2答えて

    私はAzkaban 3.0を使用しています。私は実行している単純なエコージョブを持っており、フローパラメータにsetExecutor = id#を設定してエグゼキュータを指定しています。私はtiseジョブを実行するたびに、2つのエグゼキュータの間で交互に実行されますが、2番目のエグゼキュータのみで実行するようにジョブ定義で明示的に指定されています。 設定で何か変更する必要がありますか? エグゼキュ

    0

    1答えて

    3つのジョブを含む1つのフローを持つ次のAzkaban構成では、デフォルトでJob2を無効にするにはどうすればよいですか?そのためのパラメータ/設定はありますか? 私はUIに入り、手動でジョブを無効にすることができます。しかし、私はJob2をデフォルトでは無効にしておき、必要な時にのみUIから有効にしたいと思っています。 hadoop { def input = "..."

    0

    1答えて

    Google Cloud BigtableでAzkabanを使用できますか?Apache HBaseと同じですか?

    0

    1答えて

    Azkabanフローをサーバにアップロードする前に、Azkabanフローを検証したいと思います。私たちにはプラグインなどがありますか?この検証を行うAzkaban githubのクラスは何ですか?私はちょうどそれらを適応させて、それを検証に使うことができました。

    3

    1答えて

    Google Dataflowを使用してバッチデータを処理し、ワークフローオーケストレーションツールのいくつかのオプションをAzkabanがHadoopと同様のものを探しています。我々が探しているものがある キーの事、 ワークフロー スケジュールのワークフローの設定 監視と警告失敗したワークフロー 失敗したジョブを再実行する機能 我々 Pentahoを評価しましたが、これらの機能はエンタープライズ