Maio trouxe o CloudWatch Investigations, que mudou fundamentalmente o plantao de sobreaviso de alguem. Em vez de correlacao manual de logs, este servico usa IA para realizar Automated Root Cause Analysis (RCA).

Quando um alarme dispara, o Investigations rastreia automaticamente o erro. Ele correlaciona picos de metricas com eventos concorrentes -- como um commit Git especifico, um Terraform apply ou uma alteracao de parametro do RDS. Em vez de um dashboard mostrando "500 Errors," voce recebe um relatorio dizendo: "O pico de latencia no Servico A foi causado por uma alteracao de configuracao no Servico B que disparou um vazamento de conexao no RDS."

Combinado com o CloudWatch RUM Session Replay, agora voce pode reproduzir visualmente a jornada do usuario que levou a uma falha. E efetivamente uma "Maquina do Tempo" para sua infraestrutura. Se voce ainda esta fazendo mergulho manual em logs durante incidentes, maio devolveu seus fins de semana.