Maggio ha portato CloudWatch Investigations, che hanno cambiato radicalmente la turnazione di reperibilità di molti. Invece della correlazione manuale dei log, questo servizio utilizza l'AI per eseguire l'Analisi Automatica della Causa Radice (RCA).

Quando scatta un allarme, Investigations traccia automaticamente l'errore. Correla i picchi delle metriche con eventi concomitanti, come uno specifico commit Git, un Terraform apply o una modifica dei parametri RDS. Invece di una dashboard che mostra "500 Errori", ricevi un report che dice: "Il picco di latenza nel Servizio A è stato causato da una modifica di configurazione nel Servizio B che ha innescato una perdita di connessioni in RDS."

Combinato con CloudWatch RUM Session Replay, puoi ora riprodurre visivamente il percorso dell'utente che ha portato a un crash. È effettivamente una "Macchina del Tempo" per la tua infrastruttura. Se stai ancora facendo immersioni manuali nei log durante gli incidenti, maggio ti ha restituito i weekend.