클라우드(AWS)/SOA-C02

[AWS] CloudWatch Alarm 상태 종류 (OK, ALARM, INSUFFICIENT_DATA)

찌르비 2025. 2. 10. 18:49
반응형

 

 

CloudWatch Alarm 상태(States) 종류

CloudWatch Alarm의 가장 중요한 상태 종류

 

1. OK : 알람이 정상 상태에 있을 때 (지표가 설정한 임계값을 초과하지 않음)

2. ALARM : 지표가 설정한 임계값을 초과했을 때 (경고 상태)

3. INSUFFICIENT_DATA : 알람을 설정한 지표에 대한 데이터가 부족할 때 (수집되지 않거나 미비한 데이터)

 

 

Evaluation Periods : 메트릭을 평가하는 기간 개수

예시) Evaluation Periods = 3, Period = 5분이면, 총 15분(5분 × 3) 동안의 데이터를 보고 판단

 

Datapoints to Alarm : Evaluation Periods 동안 조건을 만족해야 하는 데이터 개수

예시)  Datapoints to Alarm = 2, Evaluation Periods = 3, Period = 5분이면, 최근 3개의 데이터 중 최소 2개가 조건을 충족해야 알람이 발생한다

 

 

 

사용 예시

💡 조건: CPU 사용률이 80%를 초과하면 ALARM 발생
💡 설정 값:

  • Period = 5분 (5분마다 데이터 측정)
  • Evaluation Periods = 3 (최근 3개의 데이터로 평가)
  • Datapoints to Alarm = 2 (3개 중 2개 이상이 조건을 만족하면 ALARM)
시간 OK 상태 ALARM 상태 INSUFFICIENT_DATA 상태
12:00 CPU 사용률: 70% CPU 사용률: 70% 데이터 없음
12:05 CPU 사용률: 40% CPU 사용률: 85% 데이터 없음
12:10 CPU 사용률: 50% CPU 사용률: 90% CPU 사용률: 50%

 

반응형