オーケストレーションのプロセスに関するベストプラクティスに関するアドバイスを探しています。いくつかのコンテキストを与えるために、私は、次のタスクを編成する必要があります:AzureのバッチプールAzure Process Orchestration
- スケールアップが
- は、タスクのリストを取得するためにサーバーを呼び出すカスタムの.NETコードを実行し、適切なノードを提供します。これらのタスクは日々変化します。これらのタスクをバッチプールにキューイングします。
- バッチプールで各タスク(カスタム.Netコード)を実行します。各タスクは、Azureストレージアカウント内にデータを作成します。
- バッチプールをスケールダウンします。
- データウェアハウスの開始/スケールアップ
- データをデータウェアハウスにインポートします(PolyBaseとBCPの組み合わせを使用することを想定しています)。
- データを集約し、Azure Storageアカウントに出力します。
- 一時停止/データウェアハウスを縮小
私は現在、上記を実行するためにランブックにデータウェアハウスを比較しています。
私はRunbooksが設計時と実行時の視覚化の点で非常に原始的であると感じます。
私は、データウェアハウスが視覚的にはより重要であることがわかりました。しかし、データの分割は大規模な過度のようです。私は、プロセスが毎朝午前8時に実行されるようにするだけです。私はそれが過去の日のためにexcuteを試みることを望んでいません(もし私がテンプレートを修正すれば)。私はデータウェアハウスがアクティビティのパイプラインに沿って失敗/再開をよりうまく処理できると期待しています。
私はここで/考慮すべき他のアプローチはありますか?リストに必要なものは確かのほとんどを行うことができますので、私は幅広いっぽい答えを提供しますかなり広い質問です
おかげ デビッド
ご返信ありがとうございます。十分な幸せカスタム.Netを書く。これを答えとしてマークする前に、Runbooksを除き、Process Orchestrationを対象としたData Factoryの他の選択肢はありますか? 私はData Factoryのスライス面を理解していないかもしれませんが、「sat/sunで実行しない」などの問題や、過去にstartDateを使用してパイプラインを作成するなどの心配はありません。私はそれが今日(私は正しいstartDateでそれを作成することができますが、既存の修正について懸念していることを知っている)開始することを本当に私は今、すべての前の日付を実行したい。 – DavidReid
PowerShellはここにあなたの友人です。必要に応じて、ADFコマンドレットでスライスを無効にすることができます。 –