4월, AWS는 데이터 센터 엔지니어링의 비하인드를 살짝 공개했다. 최신 AI 클러스터의 열 출력을 처리하기 위해 Direct-to-Chip Liquid Cooling을 공개한 것이다.

이는 단순한 하드웨어 호기심 그 이상이다. 성능 관점에서 액체 냉각은 랙당 3배 더 높은 컴퓨팅 밀도를 가능하게 한다. Trainium과 Inferentia 같은 커스텀 실리콘이 공기 냉각 환경에서 자주 발생하는 열 스로틀링 없이 장시간 실행되는 학습 작업에서 최고 클럭 속도를 유지할 수 있도록 보장한다.

EC2 UltraClusters 2.0의 출시도 있었다. 이는 Elastic Fabric Adapter(EFA)를 통해 논블로킹 페타비트급 네트워킹을 지원한다. 수조 개의 파라미터를 가진 모델을 분산 학습하는 경우, 노드 간 통신 병목 현상이 사실상 제거되었다.

4월은 "클라우드"가 궁극적으로 물리 법칙에 의해 제한되며, AWS는 AI를 따라잡기 위해 말 그대로 인터넷의 배관을 재설계하고 있음을 상기시켜 주었다.