AWS

EC2の障害分析 外部グラフなしの場合

AWS

EC2に障害発生!

 

対応フロー

  1. まずサーバにログインしステータスを確認
    サービスがダウンしていたら再起動させるなり一時復旧する。
  2. ログロテートされないようにログを確保して外部に複製する
  3. グラフを確認する
  4. ログを確認する

 

 

以下の場合にCloudwatchでモニタリングすることになる

  • Muninなどで外部監視されていない場合
  • 監視エージェントをインストールできない環境の場合
  • 保守を始めたばかりのお客様との関係が間もない場合

 

 

グラフの読み取り

グラフで負荷が高くなっている

どのサービスで負荷が高くなっているのか?
→ログを確認する

データが障害時間中ない

Cloudwatchは仮想基盤が直接EC2から取得しているものなので、負荷もなくデータが消失している場合は仮想基盤の障害の可能性が高い。

  • この場合はAWSサポートに確認するしかない
  • EC2のSLAは99.99% = 年間で1時間程度ダウンタイムがあってもおかしくない基準

 

Amazonおすすめ

iPad 9世代 2021年最新作

iPad 9世代出たから買い替え。安いぞ!🐱 初めてならiPad。Kindleを外で見るならiPad mini。ほとんどの人には通常のiPadをおすすめします><

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)