2025년은 서버리스 커뮤니티에서 가장 오래된 "병목" 불만 중 하나를 해결하며 시작되었다. 수년간 동기 Lambda 호출의 6MB 페이로드 한계는 데이터가 조금만 많아져도 S3 Pre-signed URL이나 비동기 패턴을 사용해야 하는 복잡한 우회 방법을 강제했다.

1월, AWS는 공식적으로 Lambda 응답 스트리밍 용량을 200 MB로 상향했다. 기술적으로 이는 데이터 이그레스를 처리하는 방식의 거대한 변화다. response-stream 콘텐츠 타입을 구현함으로써 함수는 이제 대용량 페이로드, 고해상도 미디어, 거대한 JSON 블롭, 실시간 AI 트랜스크립션을 클라이언트에 직접 푸시할 수 있다. 클라이언트가 200MB 버퍼 전체가 닫힐 때까지 기다리는 대신 데이터가 생성되는 즉시 수신을 시작하므로 Time to First Byte (TTFB)가 크게 감소한다.

스토리지 측면에서는 S3의 고성능 단일-AZ 형제인 S3 Express One Zone이 성능 프로필 업데이트를 받았다. 작은 객체 GET에서 약 15%의 레이턴시 감소가 확인되었다. 고빈도 트레이딩 앱이나 실시간 게임 리더보드를 운영 중이라면, 이 업데이트는 사실상 "데이터까지의 거리"를 낮추었다.

엔지니어링 팁: 대규모 리포트에 여전히 기존 Invoke API를 사용 중이라면 스트리밍으로 마이그레이션하라. 프론트엔드 로직이 단순화되고 "중간" S3 버킷의 필요성이 사라진다.