본문 바로가기
AWS

CloudWatch 경보 알림을 사용한 EC2 자동 재부팅

by ballena 2024. 1. 19.

종종 EC2 상태 검사에서 실패가 발생해 EC2의 재부팅이 필요한 경우가 있습니다.

하지만 사용자가 지속적으로 EC2의 상태를 모니터링하고, 수동으로 재부팅을 하는 것은 번거로운 일입니다.

이번에는 EC2의 상태 검사가 실패할 경우 자동으로 재부팅을 진행할 수 있는 기능을 알아보겠습니다.

CloudWatch 경보 관리 선택

 

자동 재부팅을 설정하려는 인스턴스를 선택한 후, 작업 > 모니터링 및 문제 해결 > CloudWatch 경보 알림으로 이동합니다.

경보 작업 설정

 

위와 같이 경보 작업을 '재부팅'으로 설정하고, 감지하는 임계값 유형을 상태 검사 실패로 지정합니다.

 

상태 검사 실패 발생

 

EC2에 접속해 [sudo ifconfig ens5 down] 명령어를 입력해 상태 검사 실패를 발생시켰습니다.

 

상태 검사 실패 metric이 CloudWatch에 수집되면 경보가 발동합니다.

경보 발생

 

경보가 발생하고 시간이 지나면 재부팅이 진행되어 다시 상태 검사가 통과됩니다.

정상화된 인스턴스

 

 

※ 재부팅으로 상태 검사 실패가 해결된다면 좋겠지만, 재부팅을 해도 해결되지 않을 수 있습니다.

    이 경우 지속적으로 재부팅이 시도될 수 있습니다.

댓글