EC2インスタンスの監視について改めて考えてみました。
死活監視だけでも、「状態」 「ステータス」 「リタイア」 の3種類が必要な気がします。
「状態」と「ステータス」は同じような言葉なので紛らわしいのですが、この画像の通りのものです。
「リタイア」は厳密には死活監視ではないですが、死の宣告なので気がつけるようにしましょう。
1. 状態を監視する
状態の種類
状態には、pending、running、stopping、stopped、shutting-down、terminatedがあります。
詳細は インスタンスのライフサイクル をご確認ください。
状態の監視設定
状態の変化をCloudWatch イベントが検知できますので、それをトリガーにしてSNSで通知ができます。
詳細な手順はEC2 インスタンスの状態が変化したときに、カスタマイズした E メール通知を受けるにはどうすればよいですか?をご確認ください。
2.ステータスを監視する
ステータスの種類
システムステータスとインスタンスステータスの合計2つがあり、正常時は「2/2のチェックに合格しました」となります。
詳細な違いは、ステータスチェックの種類をご確認ください。
ステータスの監視設定
ステータスはメトリックからCloudWatchアラームを作成し、それをトリガーにしてSNSで通知ができます。
詳細な手順はステータスチェックアラームの作成と編集をご確認ください。
3. リタイアを監視する
リタイアとは
EC2インスタンスは仮想マシンなので、その土台としてホストマシンが存在しています。
AWSでは障害などの原因で、稀にホストマシンのリタイアが行われます。
そうすると、EC2インスタンスは再起動したり、停止したままになってしまうことがあります。
詳細はインスタンスの予定されたイベントをご確認ください。
リタイアの監視設定
突然の障害だと仕方がないのですが、事前にわかっている場合は、メール通知があります。
メールの中に対応方法が書いてあるので、それを確認しましょう。
事前にStop、Startして別のホストマシンにインスタンスを移動しましょうという内容が多いです。
AWSアカウント設定の操作の箇所のメールアドレスを設定しましょう。
操作:操作関連の通知(Trusted Adviser、サポートへのお問い合わせケースの受信、EC2 のリタイアメントプランなど)
詳細はご利用中のお客様からのよくあるご質問をご確認ください。
まとめ
EC2インスタンスに対して、まずは3種類の監視を行いましょう。
- 状態
- ステータス
- リタイア
メトリクス監視などは、それはそれで別途考えてください。
おまけ
各国の「State」と「Status」を比較してみました。 全体的に紛らわしいのですが、中国語は両方とも「状态」(状態)となっていて大変な感じです。