私たちのプライマリデータストア(および "Universal Source of Truth")がPostgresであるシステムがありますが、そのデータをリアルタイムでも夜間でも集約して複製します。私たちは現在、Elasticsearch、Redis、Redshift(夜間のみ)に複製し、Neo4jも追加しています。ほぼリアルタイムのETLアーキテクチャ用の右ツール
私たちのETLパイプラインは、AirflowとLuigiのようなツールを見ていますが、最初の研究からわかるように、これらのツールはバッチロードのためのものです。
大量のバッチETLプロセスとオンザフライで大量の個別レコード複製の両方を処理できるETLプロセスを処理できるツールはありますか?気流かLuigiはこれを処理し、私はそれを逃したのですか?
ありがとうございます!