いくつかのソースからの情報を含むAzureにデータウェアハウスを作成します。入力データは別のAPISからのもので、Pythonを使用してそれらにアクセスしたいので、出力はWarehouseに保存する必要があります。このプロセスは毎日更新する必要があります。Pythonを使用してAPIからデータを取得し、Azureデータファクトリを使用してAzure SQLデータウェアハウスにロードします。
私はAzureから多くの文書を読みましたが、このプロセスをどのように設計する必要があるのか理解できません。
最初の質問は次のとおりです。異なるAPIからデータを収集するために、Pythonプロセスをどこで作成する必要がありますか? Azureデータファクトリのパイプラインまたは他のどこかで? Azureのデータ工場で
よろしく
しかし、使用したいサービスへのコネクタがないので、Pythonスクリプトをコード化して(APIを使用して)データを取得し、それをAzure Data LakeまたはBlobストレージとしてコンテナに保存する必要があると思います。私の質問は、どの場所で私はpythonスクリプトを書くべきですか? – Alex
これらのソースはRESTエンドポイントですか?その場合、HTTPデータソースを使用することができます。https://docs.microsoft.com/en-us/azure/data-factory/connector-http –