AWS Monthly (2025년 5월): War Room의 죽음
5월은 CloudWatch Investigations를 가져왔고, 이는 온콜 로테이션을 근본적으로 바꾸어 놓았다. 수동 로그 상관 분석 대신, 이 서비스는 AI를 사용하여 자동화된 근본 원인 분석(RCA)을 수행한다.
5월은 CloudWatch Investigations를 가져왔고, 이는 온콜 로테이션을 근본적으로 바꾸어 놓았다. 수동 로그 상관 분석 대신, 이 서비스는 AI를 사용하여 자동화된 근본 원인 분석(RCA)을 수행한다.
알람이 트리거되면 Investigations는 자동으로 오류를 추적한다. 특정 Git 커밋, Terraform apply, RDS 파라미터 변경과 같은 동시 발생 이벤트와 메트릭 스파이크를 상관 분석한다. "500 Errors"를 보여주는 대시보드 대신, "서비스 A의 레이턴시 스파이크는 서비스 B의 설정 변경으로 인해 발생했으며, 이로 인해 RDS에서 연결 누수가 트리거되었다"와 같은 리포트를 받는다.
CloudWatch RUM Session Replay와 결합하면, 이제 사용자의 크래시 직전까지의 여정을 시각적으로 재현할 수 있다. 이는 인프라를 위한 "타임 머신"이나 다름없다. 인시던트 발생 시 여전히 수동 로그 다이빙을 하고 있다면, 5월이 당신의 주말을 되돌려 주었다.
Ercan의 다른 글
같은 저자, 다른 영역의 사이트 두 개.