Ο Μάιος έφερε τα CloudWatch Investigations, που άλλαξαν θεμελιωδώς το on-call rotation κάποιου. Αντί για χειροκίνητο log correlation, αυτή η υπηρεσία χρησιμοποιεί AI για να εκτελέσει Automated Root Cause Analysis (RCA).

Όταν ενεργοποιείται ένας alarm, το Investigations εντοπίζει αυτόματα το σφάλμα. Συσχετίζει τις αιχμές των metrics με ταυτόχρονα γεγονότα, όπως ένα συγκεκριμένο Git commit, ένα Terraform apply ή μια αλλαγή παραμέτρου στο RDS. Αντί για ένα dashboard που δείχνει «500 Errors», λαμβάνεις μια αναφορά που λέει: "Το latency spike στο Service A προκλήθηκε από μια αλλαγή configuration στο Service B που πυροδότησε ένα connection leak στο RDS."

Σε συνδυασμό με το CloudWatch RUM Session Replay, μπορείς πλέον να αναπαράγεις οπτικά το ταξίδι του χρήστη που οδήγησε σε ένα crash. Είναι ουσιαστικά μια «Μηχανή του Χρόνου» για την υποδομή σου. Αν εξακολουθείς να κάνεις χειροκίνητο log-diving κατά τη διάρκεια incidents, ο Μάιος σου έδωσε πίσω τα Σαββατοκύριακά σου.