Em abril, a AWS nos deu uma espiada nos bastidores da engenharia de seus data centers. Para lidar com a emissao termica dos mais recentes clusters de IA, eles revelaram o Direct-to-Chip Liquid Cooling.

Isso e mais do que apenas uma curiosidade de hardware. Do ponto de vista de desempenho, o resfriamento liquido permite uma densidade de computacao 3x maior por rack. Ele garante que silicon personalizado como Trainium e Inferentia possa manter velocidades de clock maximas para jobs de treinamento de longa duracao sem o throttling termico que frequentemente afeta ambientes refrigerados a ar.

Tambem vimos o lancamento dos EC2 UltraClusters 2.0, que suportam rede nao bloqueante em escala de petabit via Elastic Fabric Adapter (EFA). Se voce esta treinando modelos distribuidos com trilhoes de parametros, o gargalo de comunicacao entre os nos foi virtualmente eliminado.

Abril nos lembrou que "a nuvem" e, em ultima analise, limitada pelas leis da fisica, e a AWS esta literalmente reengenhando o encanamento da internet para acompanhar a IA.