【連載Zabbix】予測機能でディスクサイズ監視

AWS運用自動化サービス「Cloud Automator」
この記事は1年以上前に書かれたものです。
内容が古い可能性がありますのでご注意ください。

カスタマーサポート課の伊藤です。
サーバーワークスZabbixスペシャリスト 九龍として
Zabbix3.0、3.2の新機能を活用した監視手法をご紹介していきます。
第1回目は予測機能を用いたディスクサイズ監視手法をご紹介します。

これまでの監視設定

通常のシステムではDISKFULL になった場合、データの書き込みなどが出来なくなるため
ディスク空き容量の監視を行っています。
この際、ディスク増強や不要ファイル削除などの作業計画の時間を確保するため
ディスク使用率監視では75%や80%などの余裕のある閾値を設定する方法が一般的です。
閾値をホスト毎に変えるような場合はテンプレートマクロを使用して次のように設定していました。
2016-11-04_19h06_39しかし、実際のデータ格納領域では無く、WindowsのCドライブなどシステム領域では
不足しなければ問題が無いため、初期状態のディスク使用率が80%程度で、そのまま増加しないという設計などがあります。

chart2-1

Zabbix 2.4 までは、実測値による判定しか出来なかったため、
この場合Cドライブでは無用な障害アラートが出続ける、もしくは、Cドライブのアラートだけ無効化する等の対応が必要でした。

予測機能を使った監視設定

Zabbix 3.0 では収集したデータを元に線形回帰を行い、未来値を予測することが出来るようになりました。
Zabbix 3.0 の予測機能の詳細については、Zabbix 3.0 の予測機能についての数学的考察 をご覧下さい。

Zabbix 3.0 では、予測機能としてforecast関数、timeleft関数が追加されました。
この関数によって指定期間後の予測値、あるいは指定予測値への到達時間を元に
障害判定を行う事ができるようになりました。

Zabbixのトリガーウィザードでは以下のように表示されます。
2016-11-05_11h25_51なお、Zabbix 2.4 以降では 以上、以下として >=,<= という判定演算子が使えるようになっていますが
トリガーウィザードにはまだ反映されていませんので、以上、以下の判定を行いたい場合は、
ウィザードで条件式作成後に手動で条件式を修正してください

この関数を利用したトリガーの組み方は次のようになります。

2016-11-05_10h52_05

パラメータにユーザマクロが使用できますので、期間や閾値を個別に変更することができます。

まとめ

Zabbix 3.0 の予測機能を使うことで、使用率が高いものの、その使用率に変化が無いディスクについてはアラートを上げずに、実際に容量枯渇が予測されるディスクだけを通知することが可能になります。
さらに、容量などの数値そのものではなく枯渇するまでの予測期間を元に判定を行う事ができるため慌てずに、組織の体制や決裁に要する期間などに合わせた監視を行うことが出来るようになります。

次回は、ZabbixServer-Agent間の通信暗号化についてご紹介を予定しています。

AWS運用自動化サービス「Cloud Automator」