2016-11-22 7 views
0

ネットワーキングクラスを使ったことは一度もありませんが、私はそのことを学んでいます。 TCP/IPネットワーキングのようなもの私はかなり基本的な把握があり、これが私の試みを妨げると思うのなら、私に知らせてください。分散モニタリングとネットワークでの遅延/ドロップのトラッキングのための良い設定

私が手がけている課題は次のとおりです。OpenStackネットワークには、互いに通信できるノードが多数あり、すべてのCentOS仮想マシン(単純化のため)がアプリケーションを実行しています。タスクは、基本的には、あらゆるノードのpingを監視し、発生したことを報告する何らかの種類のメッセージ(たぶんhttpを介して)を報告する方法を見つけることです。実際のレイテンシーの問題をチェックするロジックは、私が苦労しているものではなく、このタスクを完了するのに最適な構造です。

Nagiosを使用し、分散監視システムを設定することを考えています。基本的に私の計画は、プラグインを作成した後、各ノードにNagiosをインストールすることです(既に提供されているか存在している場合を除きます)。ネットワークに参加したという設定と他のノードは、が検出される。ノードの数が増えれば、他のすべてのノードにpingを実行すると、実際には良いことになるからです。それは実際にネットワークに多くのストレスを与えることになりますか?

これは悪い考えですか?私はより効率的な解決策は、すべてのノードがチェックされている限り(必ずしもすべてのノードが他のすべてのノードに接続される必要はない)、より効率的であることを知っています。いくつかの点をグラフとして視覚化すると、可能なすべての点ではなく各点を接続するパスが1つしかない双方向グラフになります。しかし、これが私がそれについて考えなければならないレベルかどうかは分かりません。

つまり、私は何を求めているのですか:オープンスタックノードの束の間でping監視システムを設定するにはどうすればいいですか?

この質問が当てはまる場合は教えてください。ありがとう。

+1

これは混乱のように聞こえる。 NetFlowやIP SLAのように、ネットワーク上のものを監視するものがあります。ちなみに、pingはICMPの遅延を測定するだけで、実際のネットワークトラフィックとは何の関係もありません。 –

+0

大丈夫ですが、これらの仮想マシンは待ち時間をチェックしたいので、物理的なルータはありません。また、基本的に同じことを正しく測定する「ping-like」ツールがありますか? fpingやtcpingなどのように、なぜあなたはこの状況でナギオスに行かないのですか? – frei

+1

NetFlowおよびIP SLAにはさまざまな実装があります。 VM間のネットワークにはまだレイヤー2およびレイヤー3ネットワーキングが使用されており、これらのツールを使用して実際のトラフィックを測定できます。それがまさにこれらのツールが設計された理由です。あなたは単にホイールを再発明しようとしています。 –

答えて

-1

あなたはこの設定で何を達成しようとしているのかまだ分かりませんが、説明しているNagiosセットアップは音が厄介で、必要なものをカバーしない可能性があります。私は、各ホストのプロビジョニングにpacketbeatを組み込み、そのデータをElasticsearchに送信することを検討します。これにより、実際のアプリケーションレベルのトラフィックと応答時間を監視できます。 https://www.elastic.co/products/beats/packetbeat

+0

よく問題はより明確になっています。私はノード間の待ち時間をチェックするだけで、ネットワークトラフィックに関わるスーパーではありません。基本的にポブレム(誰かがネットワークが遅いと苦情を言います)がある場合は、問題が終わりか私達のどちらかであるかどうかを判断する方法が必要です。問題のあるノードに別の場所からpingを実行するか、 /スパイク、それらのpingを追跡しても問題ありません。私はおそらくログを保持している集中化されたホストコンピュータを持っているでしょう。私はアプリケーション層に対処する必要はありません – frei

関連する問題