3

Google Dataflowを使用してバッチデータを処理し、ワークフローオーケストレーションツールのいくつかのオプションをAzkabanがHadoopと同様のものを探しています。我々が探しているものがあるGoogleのデータフロー用のワークフローオーケストレーション

キーの事、

  • ワークフロー
  • スケジュールのワークフローの設定
  • 監視と警告失敗したワークフロー
  • 失敗したジョブを再実行する機能

我々 Pentahoを評価しましたが、これらの機能はエンタープライズ版のexpensiv e。 現在、Azkabanはjavaprocessジョブタイプをサポートしているため、Azkabanを評価中です。しかし、Azkabanは主にHadoopジョブ用に作成されているため、Hadoopインフラストラクチャとの統合が深く、その後は単純なjavapプロセスです。

オープンソースのソリューションや非常に低コストのソリューションをお勧めします。

答えて

1

Apache Airflow(https://github.com/apache/incubator-airflow)がニーズを満たす必要があり、データフロー演算子(https://github.com/apache/incubator-airflow/blob/master/airflow/contrib/operators/dataflow_operator.py)があるようです。

+0

ありがとうございました。私たちは気流を評価して、それが働くかどうかを調べ始めました。 –

+0

@ user73827評価はどのように行われましたか? – Andrew

+0

気流に関するコメントはありますか?私はとても興味があります。 – Mario

関連する問題