システム監視・性能測定のアプリ3種類を比較した: Nagios, Munin, Zabbix
いままではシステムのリソースなどの監視を Muninで、アラートメールの通知を Nagios という具合に組み合わせてシステム監視・測定をしていた。 最近 zabbix がよいよ、という話をちらほらと聞いたので、比較検討してみた。 Nagios http://www.nagios.org/ システムの停止や危険状態な状態などを通知したり記録する機能を持っている。 仕組みとしては、監視を行うホストから ping や TCP接続やTCP/UDPを用いた通信を行い、設定した閾値によって warning, critical, flapping, down などの判定を行い、これをメールなどで通知したり記録する。 NRPE (Nagios Remote Pliugin Executor) を使うと、監視対象のマシン内でNagiosのプラグインが実行でき、監視サーバ1台に対して複数の監視対象マシンを監視できる。 よい点 プラグインが豊富で、監視対象となる機能が多い。 Ubuntu や Fedora ではパッケージとして公開しているので、インストールが楽 よくない点 設定が面倒。 設定時に、host, hostgroup, service, servicegroup, contact, contactgroup などがあり、これのリレーションが理解できるまで手間取った。 設定をテキストファイルで書かなければならないので、面倒 CPU load average などのシステムの状態を記録してグラフにするなどの機能が実装されていないので、機能としては監視→通知のみ。 Munin http://munin-monitoring.org/ 性能測定対象 (munin-node) のシステムの状態の数値を muninサーバが取得、記録し、グラフにする機能。 よい点 インストールが簡単。 測定対象ホストに munin-node にインストールして、muninサーバのIPアドレスを接続元ホストのルールに追加するだけ。 muninサーバでは測定対象ホストのリストを書くだけ。 性能測定対象が豊富。 Apache HTTPDの mod_status の結果や、MySQLのスレッド数や slow query の数などを測定できるぐらいに、かなり至れり尽くせりな状態。 よくない点 性能測定の結果を取得し