サーバを何十台も稼働させているとEC2インスタンスが突然落ちることも少なからず起こってきます。 突然落ちる原因の1つとして「Status Checked Failed」になることがあります。こうなった場合はEC2インスタンスを再起動しなければなりません。自動化するのも少々面倒です。
そこで、昨年リリースされた機能ですが、Auto Recoveryというのがあったので簡単ですが調べてみました。
AutoRecoveryとは
- EC2インスタンスが動作している物理上のホストに障害が発生した場合に自動的に再起動して復旧してくれる機能
- CloudWatchで特定のEC2インスタンスで
StatusCheckFailed_System
メトリクスに対して、Recoverアクションを実行する - リリース当初はUS Eastのみ使用できていたが、2015年3月12日からTokyoリージョンでも使えるようになった
設定条件
以下のEC2インスタンスでRecoverアクションがサポートされています。
- C3、C4、M3、M4、R3、および T2 インスタンスタイプ
- VPC のインスタンス
- 共有テナンシーのインスタンス(インスタンスのテナント属性が default に設定されている)
- 排他的に Amazon EBS ストレージを使用するインスタンス
以下のEC2インスタンスではサポートされていません。
設定方法はCloudWatchのアクションで「Recover this instance」を選択すればいいのでとても楽ですね。
使いたいと思ったのですが、インスタンスストアをマウントしているEC2インスタンスでは設定できないのがとても痛いです。
今後アップデートされるかわかりませんが、インスタンスストアがマウントしているEC2インスタンスでもできるようにしてほしいです。