AWS Monthly (Mai '25): A Morte da Sala de Guerra
Maio trouxe o CloudWatch Investigations, que mudou fundamentalmente o plantao de sobreaviso de alguem. Em vez de correlacao manual de logs, ...
Maio trouxe o CloudWatch Investigations, que mudou fundamentalmente o plantao de sobreaviso de alguem. Em vez de correlacao manual de logs, este servico usa IA para realizar Automated Root Cause Analysis (RCA).
Quando um alarme dispara, o Investigations rastreia automaticamente o erro. Ele correlaciona picos de metricas com eventos concorrentes -- como um commit Git especifico, um Terraform apply ou uma alteracao de parametro do RDS. Em vez de um dashboard mostrando "500 Errors," voce recebe um relatorio dizendo: "O pico de latencia no Servico A foi causado por uma alteracao de configuracao no Servico B que disparou um vazamento de conexao no RDS."
Combinado com o CloudWatch RUM Session Replay, agora voce pode reproduzir visualmente a jornada do usuario que levou a uma falha. E efetivamente uma "Maquina do Tempo" para sua infraestrutura. Se voce ainda esta fazendo mergulho manual em logs durante incidentes, maio devolveu seus fins de semana.
Mais de Ercan
Mais dois sites, mesmo autor, terreno diferente.
IA, LLMs, agentes, ML aplicado.
Notas de campo sobre cargas de IA. Análise de custos do Bedrock, padrões de agentes, trade-offs de armazenamento vetorial, modos de falha em produção.
Visitar ercan.ai →O hub. Sobre, consultoria, contato.
Hub pessoal para as duas trilhas de escrita. Quem sou eu, como funciona a consultoria, como me contatar.
Visitar ercanermis.com →