2009-06-18 22 views
3

実稼働環境でどのようにアプリケーションを監視しますか?例えば、ログ、稼働時間、等...(私は外部アプリケーション、フリーでオープンソースを好む)アプリケーション、稼働時間、ログファイルなどを監視する

、私は、アプリケーションがダウン

  • なった場合にアラートを送信するために

    1. 能力をしたいと思います設定されたしきい値よりも> CPU使用率場合はアラートを送信
    2. メモリ使用量が>エラーメッセージの設定した閾値
    3. 送信警告よりも
    4. が設定可能でなければならない場合X TIが発生した場合、アラートは、おそらくいくつかのエラーは、アラート送信
    5. 送信Y期間内のメッシュ
  • +0

    これは実際にはサーバーの問題に関するものです。それは言った:Nagios、Netcoolなど – Joe

    答えて

    -2

    Google Analytics ???

    +0

    これは間違った答えです。 – phoxis

    3

    どのようなアプリケーションですか?

    私は過去にNagiosを使用しました。それは無料でオープンソースです。アラートの設定、イベントログの監視、アプリケーション固有のログの監視、サーバーインフラストラクチャとネットワーク自体の監視を行うことができます。

    http://www.nagios.org/

    0

    Nagiosは進むべき道である - 学習曲線のビットが、カスタマイズと強力な。また、ファイル、ディスクスペースなどを監視することができるサーバー側のデーモンがあります。

    0

    私たちは監視ソフトウェアの自宅造りのカスタム部分を持っています。

    さまざまなライブマシン(およびテスト)のイベントログを、Webアプリケーションによって生成されたエラーについて監視します。すべてのWebアプリケーションは、エラーログを例外として書き出します。また、サーバーにpingを実行してドライブスペースを監視します。

    私たちが定義したすべてのサーバーを監視するサーバーアプリケーションをポーリングするすべての開発マシンにクライアントアプリケーションがあります。このクライアントアプリケーションはタスクトレイで実行され、何かが標準外の場合にメッセージをポップアップして、開発者が即座にそれを見るようにします。テスト担当者がエラーを見つけたときに、テスト担当者がエラーを報告するまでに、通常は修正プログラムまたは少なくとも修正プログラムがあることも確認できます。

    サーバーは配布グループにも電子メールを送信し、重要なエラーが必要な場合には表示されないようにします。

    また、あらかじめ定義された例外/エラーも抑制することができます。

    1

    多くの人々がデータ指向のソリューションに移行しています。ほとんどの監視ツール(nagiosなど)は静的なチャートを提供していますが、今日のアプリは高度に分散されており、トランザクションは複数のサーバーにまたがっており、状況は狂っています。 kpisやシンプルなapisを超えた先進的な機能のためには、LogscapeSplunkのようなマシンデータソリューションを探す必要があります。これらのツールを使用すると、フレキシブルで、対話的にドリルダウンして非常に豊富な根本原因分析を提供できるダッシュボードなどを作成できます。このページのいくつかのアプリを見てくださいLogscapeApps

    関連する問題