私はAzure BLOBストレージにたくさんのファイルを持っており、新しいファイルを絶えず入手しています。 Blobのすべてのデータを最初に取り出し、BigQueryに移動してスクリプトやジョブを実行して、そこにあるすべての新しいデータがBigQueryに送られるようにする方法があるかどうかは疑問でした。Azure BLOBからBigQueryにデータを連続的にパイプする方法はありますか?
答えて
BigQueryはquerying data directly from these external data sourcesのサポートを提供しています:GoogleクラウドBigtableの、Googleのクラウドストレージ、Googleドライブ。 Azure BLOBストレージは含みません。 Adam Lydickが言及したように、回避策としてAzure BlobストレージからGoogle Cloud Storage(またはその他のBigQueryサポートの外部データソース)にデータ/ファイルをコピーできます。
GoogleクラウドストレージへのAzureブロブストレージからデータをコピーするには、WebJobs(またはAzure Functions)を実行することができ、およびBLOBが作成または更新されたときBlobTriggerred WebJobは、機能を起動することができますWebJob機能で使用すると、ブロブコンテンツにアクセスすることができますし、書き込み/ Google Cloud Storageにアップロードします。
注::このライブラリをインストールすると、クライアントコードで一般的な操作を行うことができます。Google.Cloud.Storagethis blogは、Azure関数でGoogle.Cloud.Storage sdkを使用する方法を説明しました。
私はこれを達成できる(Googleのインフラストラクチャ上で)何も気づいていません。
私は多分に小さなVMを設定したい:
- は、新しいコンテンツを探して、あなたのAzure BLOBストレージをスキャンします。
- 新しいコンテンツをGCS(またはローカルディスク)にコピーします。
- 定期的にLOADジョブをキックオフして、新しいデータをBigQueryに追加します。
あなたの代わりにAzureブロブストレージのGCSを使用した場合は、VMを排除し、ちょうどあなたのGCSバケットに追加された新しいアイテムにトリガーされるクラウド機能を持つことができます(あなたのブロブは、BigQueryのは知っている形であると仮定すると読み方)。私はこれが既存のソリューションの一部であると推測していますが、あなたはそれを変更したくないと思っています。
ありがとう、アダム!私はそれが私と一緒に行く風になると思う。はい、これはBlobにこれらのファイルを常に追加する既存のソリューションの一部です.GCSに直接追加する方法はありません。私はすぐにそれを開始する:) – Michael
- 1. CKFinderをAzureストレージBLOBに接続する方法はありますか?
- 2. Unity3dでは、.txtファイルから位置データを連続的に読み取る方法はありますか?
- 3. 名前付きパイプから連続的に読み取り
- 4. SQL Azureでトリガー削除からAzure blobストレージ内のファイルを削除する方法はありますか?
- 5. AzureのBLOBストレージからJupyterノートブックにデータをアップロードするには?
- 6. AzureのBLOBストレージのウィルスチェック方法についてのアイデアはありますか?
- 7. コマンドラインからNodeJにスクリプトをパイプする方法はありますか?
- 8. vimバッファをlprにパイプする方法はありますか?
- 9. ファイル名をtarにパイプする方法はありますか?
- 10. Azure BLOBのデータをAzure Data Lakeにコピーするベスト(クイック)方法
- 11. Excelから自動的にデータをエクスポートする方法はありますか?
- 12. npmスクリプトからbashエイリアスにパイプする方法はありますか?
- 13. rxjavaでクライアントにデータを連続的にストリームする方法は?
- 14. Talendから1010データに接続できる方法はありますか?
- 15. Blobストレージに書き込まれるAzureデータファクトリファイルの名前を可変にする方法はありますか?
- 16. azureデータベースからblobストレージクレデンシャルを削除してbacpacローカルリストアを許可する方法はありますか?
- 17. AWS RedshiftをMicrosoft Azure MLに接続する方法はありますか?
- 18. カスタムソースからデータを連続的に書き出します。
- 19. 「連続」オートフォーカスを行う効率的な方法はありますか?
- 20. 継続インテグレーションを使用してAzure Blobストレージをgithubからアップロードする方法
- 21. Azure連続Webジョブ関数呼び出しにプログラムでアクセスする方法はありますか?
- 22. AzureのApp InsightにSQLデータを送信する方法はありますか?
- 23. AzureデータウェアハウスはBLOBストレージからデータをロードします
- 24. ブロッキングキューからデータを連続的にフェッチする
- 25. JTextFieldのデータをJTableに連続的に追加する方法
- 26. DataprocでBigQueryを使用する方法はありますか?
- 27. Azure BLOBストレージ - 仮想ディレクトリに子がありますか?
- 28. JavaアプリケーションからBigQueryにデータを取り込む方法
- 29. MySQLで連続的にインクリメントするカウンタを再インデックスする方法はありますか?
- 30. PythonでazureブロックBLOBにデータをストリームする方法
[こちら](https://www.stitchdata.com/integrations/microsoft-azure/google-bigquery/)の記事が役立つ可能性があります。 –
ありがとう!私は気付きましたが、長期的な統合のために、(私が転送する必要があるデータ量の)購読は月に500ドルです。私は一貫して無料のソリューションを見つけることを目指しています(ただし、これがもう少し可能であるかどうかを確認します) – Michael
残念ながら、データはデータベースにもありません。これはAzure Blobストレージにありますが、Stitchでは統合ができません。 – Michael