2010-03-31

システム監視・性能測定のアプリ3種類を比較した: Nagios, Munin, Zabbix

いままではシステムのリソースなどの監視を Muninで、アラートメールの通知を Nagios という具合に組み合わせてシステム監視・測定をしていた。 最近 zabbix がよいよ、という話をちらほらと聞いたので、比較検討してみた。


Nagios


http://www.nagios.org/


システムの停止や危険状態な状態などを通知したり記録する機能を持っている。 仕組みとしては、監視を行うホストから ping や TCP接続やTCP/UDPを用いた通信を行い、設定した閾値によって warning, critical, flapping, down などの判定を行い、これをメールなどで通知したり記録する。 NRPE (Nagios Remote Pliugin Executor) を使うと、監視対象のマシン内でNagiosのプラグインが実行でき、監視サーバ1台に対して複数の監視対象マシンを監視できる。



よい点


  • プラグインが豊富で、監視対象となる機能が多い。

  • Ubuntu や Fedora ではパッケージとして公開しているので、インストールが楽


よくない点


  • 設定が面倒。

  • 設定時に、host, hostgroup, service, servicegroup, contact, contactgroup などがあり、これのリレーションが理解できるまで手間取った。

  • 設定をテキストファイルで書かなければならないので、面倒

  • CPU load average などのシステムの状態を記録してグラフにするなどの機能が実装されていないので、機能としては監視→通知のみ。



Munin


http://munin-monitoring.org/


性能測定対象 (munin-node) のシステムの状態の数値を muninサーバが取得、記録し、グラフにする機能。



よい点


  • インストールが簡単。 測定対象ホストに munin-node にインストールして、muninサーバのIPアドレスを接続元ホストのルールに追加するだけ。 muninサーバでは測定対象ホストのリストを書くだけ。

  • 性能測定対象が豊富。 Apache HTTPDの mod_status の結果や、MySQLのスレッド数や slow query の数などを測定できるぐらいに、かなり至れり尽くせりな状態。


よくない点

  • 性能測定の結果を取得しグラフにするだけの機能しか持っていない。 一定閾値を超えたら警告としてメールを送る、といった機能がない。


Zabbix


http://www.zabbix.jp/


性能測定と記録、グラフ作成と、監視による通知を一気に行える。 操作はWebUIを使って行う。



よい点


  • WebUIを使って設定できる

  • 性能測定・記録と監視が一つのパッケージで行える。


よくない点


  • インストールが面倒。 測定結果や設定内容をRDBMSに保存するようになっているので、この辺の設定も必要

  • 性能測定できる対象がmuninに比べて少ない。 同様に監視対象も nagiosより少ない



最初はzabbixがパーフェクトな答えかなと思っていたのだが、監視・測定対象の少なさから脱落いたしました。


ってところで、よろしくご検討ください。

0 件のコメント:

コメントを投稿