Abbiamo iniziato il 2025 affrontando una delle lamentele sul "collo di bottiglia" più vecchie nella community serverless. Per anni, il limite di payload di 6MB per le chiamate sincrone Lambda ci ha costretto a complessi workaround che coinvolgevano URL pre-firmati S3 o pattern asincroni per qualsiasi cosa fosse anche solo lontanamente pesante in termini di dati.

A gennaio, AWS ha ufficialmente portato le capacità di streaming della risposta Lambda a 200 MB. Tecnicamente, questo è un cambiamento massiccio nel modo in cui gestiamo l'egress dei dati. Implementando il content type response-stream, le tue funzioni possono ora inviare payload enormi, media ad alta risoluzione, giganteschi blob JSON o trascrizioni AI in tempo reale direttamente al client. Questo riduce drasticamente il Time to First Byte (TTFB) perché il client inizia a ricevere i dati man mano che vengono generati, invece di aspettare che l'intero buffer da 200MB si chiuda.

Sul fronte storage, S3 Express One Zone, il fratello ad alte prestazioni single-AZ di S3, ha ricevuto un aggiornamento del profilo prestazionale. Abbiamo visto circa una riduzione del 15% della latenza per le GET di oggetti piccoli. Se gestisci app di trading ad alta frequenza o classifiche di gaming in tempo reale, questo aggiornamento ha effettivamente ridotto la tua "distanza dai dati".

Consiglio di Ingegneria: Se stai ancora usando la vecchia API Invoke per report di grandi dimensioni, migra allo streaming. Semplifica la logica del frontend ed elimina la necessità di bucket S3 "intermedi".