連合収集間隔を早く完了させるために調整できるものを決定しようとしています。データセンター内の私達のコレクターのペアから連盟scrape_duration_seconds {仕事=「フェデレーション」}に基づい〜59秒、フェデレーションの60スクレープ間隔を上回るされPrometheus連合の縮尺
私たちのセットアップ 2つのコレクタそれぞれがすべてのサーバー(〜1500を指摘)と、2つのコレクターの1つから収集する1つのフェデレーション・サーバー。コレクタの間隔は30秒で、フェデレーションサーバーは60秒です。問題が発生しているデータセンターには、約80万のメトリックがあります。フェデレーションサーバーは6proc、16GB RAM、およびバージョン1.6.2を実行しています。
-storage.local.targetヒープサイズ= 10737418240 -storage.local.num-指紋ミューテックス= 8192
があり、他の明白なカスタマイズの私が行方不明ですか?私はいつもより多くのコレクターペアを展開することができますが、60インターバル内に1つのコレクターからフェデレーション層を収集することはできないと心配しています。私たちの設計では、複数のコレクタペアからフェデレーションするデータセンターごとに1つのフェデレーションサーバー(1..N環境用)を想定しています。考慮すべきより良い設計がありますか?
私はこれらのリンクを確認しましたが、進める方法がわかりません。 https://prometheus.io/docs/operating/storage/#settings-for-high-numbers-of-time-serieshttps://prometheus.io/docs/operating/storage/#helpful-metrics