Der Mai brachte CloudWatch Investigations, was die Bereitschaftsdienste grundlegend verandert hat. Statt manueller Log-Korrelation verwendet dieser Service KI zur Durchfuhrung einer automatisierten Root Cause Analysis (RCA).

Wenn ein Alarm ausgelost wird, verfolgt Investigations automatisch den Fehler. Es korreliert Metrik-Spitzen mit gleichzeitigen Ereignissen -- wie einem bestimmten Git Commit, einem Terraform Apply oder einer RDS-Parameteranderung. Statt eines Dashboards mit "500 Errors" erhaltst du einen Bericht, der besagt: "Die Latenzspitze in Service A wurde durch eine Konfigurationsanderung in Service B verursacht, die ein Connection Leak in RDS ausgelost hat."

In Kombination mit CloudWatch RUM Session Replay kannst du jetzt die User Journey, die zu einem Absturz gefuhrt hat, visuell reproduzieren. Es ist effektiv eine "Zeitmaschine" fur deine Infrastruktur. Wenn du bei Incidents immer noch manuell Logs durchsuchst, hat dir der Mai deine Wochenenden zuruckgegeben.