2

AWSでOracle RDSデータベースを監視している経験がある方は、一般的なアドバイスを求めています。私が取り組んでいるシステムには、AWSに数台のエンタープライズOracle RDSデータベース(数十程度)が含まれています。 EC2インスタンス上のOMSとリポジトリデータベースを収容し、私たちのRDSインスタンスにOEM_AGENTを有効にすることにより、AWSクラウドでのコントロールを設定するAWSでのOracle監視:EM ExpressとCloudコントロール

  1. :私の組織は、監視のための2つのオプションを検討しています。
  2. EM Express/CloudWatchと、クラウドコントロールのオーバーヘッドなしで使用できる他のサードパーティ製のソフトウェアに完全に依存しています。オプション1と

懸念は、それが従来のオンプレミスのOracleデータベースを維持するための管理オーバーヘッドの一部を削除するには、すなわち、RDSに移動するため、私たちの理由を損なうということです。 OMSはリポジトリへのSYSレベルのアクセスを必要とし、RDSはこれを許可しないため、OEMリポジトリデータベースはRDSに格納できません。その結果、クラウドコントロールを導入するには、多くの種類のメンテナンスが必要になります。

オプション2の問題は、主にメトリックアラートの不足です。 CloudWatch /拡張監視では、アラートの基本メトリックがいくつか提供されますが、アラート・ログ・エラー、表領域、長期実行問合せ、使用されたアーカイブ領域などのメトリックとアラートが欠けています。 EM Expressは、パフォーマンスモニタリングの観点から必要なものを提供しています。すべての異なるデータベースへのリンクを含む内部ページを作成するだけで、集中化の欠如は気にしません。唯一の関心事は、実際には警告する指標がないことです。これを行う方法が他にもない場合は、アラートをトリガーする独自のPL/SQLスクリプトを作成することもできます。

しかし、他の人がどのようにこの問題を解決したのか、または一般的に、どのようなAWSベースのOracle監視システムが設定され、どのように機能しているのかが不思議です。

答えて

0

今日、雲に動いているほとんどすべての企業が直面している問題です。企業は管理業務の一部を取り除くためにクラウドに移行し、オンサイトで行っていたすべてのカスタマイズを行うことはできません。

ここで、オプション2を改善する方法を示します。特に、唯一の懸念は本当に

  1. RDSのイベントを警告するメトリックの欠如である、あなたの懸念

    に対処するためのモニタリングのための良い方法です。イベントを購読したり、電子メールをグループ化したり、チャンネルをゆるめたり、pagerdutyのような第三者の監視ツールに通知することができます。

  2. ラムダとのRDSイベント統合の使用。ラムダを見てみることを強くお勧めします。上記のように、イベントの購読とは別に、ラムダ関数を呼び出す/トリガーして特定のイベントを処理することもできます。 mysqlのスレーブスキップエラーを克服するためにLambdaを使用します。

  3. ラムダの別の使用例は、cronジョブの代わりです。増分バックアップが夜間に行われることを確認するために、毎日ディスク容量を調べるようなことがあります。

これらのオプションを「実装する方法」について特定の質問がある場合は、教えてください。私はより多くの情報を追加してうれしい。

+1

はい、RDSイベントは高度なインフラストラクチャの監視に非常に役立ちますが、RDSイベントではこれを提供していないため、問題は内部データベースの監視です。 – amparito

+0

@amparitoそうです。 RDSイベントは細分化されていません。これを克服するには、モニタリングスクリプトをラムダ関数に変換するか(簡単なタスクではない)、マネージャボックス(別のEC2)にスクリプトをロードしてすべてのRDSで実行させます。 – vira

関連する問題