A Microsoft revelou vários novos desenvolvimentos em design de chips personalizados e infraestrutura de IA durante o evento Microsoft Ignite desta semana, incluindo a expansão de seu portfólio de silício.
A Microsoft anunciou vários desenvolvimentos importantes em design de chip personalizado e infraestrutura de IA no Ignite 2024. A empresa está expandindo seu portfólio de silício com novos chips de segurança e processamento de dados, ao mesmo tempo em que aprimora sua parceria com a NVIDIA para computação de IA. Essas atualizações visam melhorar a eficiência, a segurança e o desempenho em todos os serviços de nuvem da Microsoft.
Revolução do silício personalizado da Microsoft
A Microsoft está expandindo significativamente seu portfólio de silício personalizado além dos aceleradores de IA do Azure Maia e das CPUs do Azure Cobalt. Eles introduziram o Azure Integrated HSM, um chip de segurança interno projetado para aprimorar o gerenciamento de chaves sem comprometer o desempenho. Em 2025, a Microsoft adicionará o módulo de segurança HSM em todos os novos servidores de data center para proteger cargas de trabalho confidenciais e de uso geral.
A Microsoft também apresentou o Azure Boost DPU, sua primeira unidade de processamento de dados. Este chip especializado lida com cargas de trabalho centradas em dados com eficiência excepcional. Novos servidores com esta DPU reduzirão o uso de energia em dois terços e terão desempenho quatro vezes melhor do que os servidores atuais.
Infraestrutura de refrigeração e energia
A Microsoft apresentou seu rack “sidekick” de resfriamento líquido de última geração. Esta unidade de trocador de calor pode ser adaptada aos data centers do Azure para dar suporte a sistemas de IA em larga escala, incluindo a infraestrutura GB200 da NVIDIA. Eles também colaboraram com a Meta em um design de rack de energia desagregado com energia CC de 400 volts, permitindo até 35% mais aceleradores de IA em cada rack de servidor.
Em um movimento em direção ao avanço em todo o setor, a Microsoft está disponibilizando publicamente essas especificações de rack de resfriamento e energia por meio do Open Compute Project, permitindo que todo o setor se beneficie dessas inovações.
Infraestrutura de IA e computação de próxima geração
A infraestrutura de IA do Azure continua a evoluir com a introdução da série ND H200 V5 Virtual Machine, apresentando GPUs H200 da NVIDIA. A plataforma demonstrou melhorias de desempenho notáveis, superando o padrão de benchmarking do setor por um fator de dois entre GPUs NVIDIA H100 e H200.
A Microsoft também anunciou o Azure ND GB200 v6, uma nova série de VM otimizada para IA que incorpora o design de escala de rack NVIDIA GB200 NVL 72 com rede Quantum InfiniBand. Esse avanço permite o desempenho de supercomputação de IA em escala, conectando dezenas de milhares de GPUs Blackwell.
Para supercomputação baseada em CPU, as novas máquinas virtuais Azure HBv5, equipadas com processadores AMD EPYC™ 9V64H personalizados, prometem desempenho até oito vezes mais rápido do que as alternativas atuais e estarão disponíveis para visualização em 2025.
Aplicativos de contêiner do Azure e integração com NVIDIA
O Azure Container Apps agora oferece suporte a GPUs NVIDIA, permitindo implantação de IA simplificada e escalável. Esta plataforma de contêiner sem servidor simplifica a implantação e o gerenciamento de aplicativos baseados em microsserviços ao abstrair a infraestrutura subjacente. Com faturamento por segundo e recursos de escala para zero, os clientes pagam apenas pela computação que usam, garantindo utilização econômica e eficiente de recursos.
A plataforma NVIDIA AI no Azure inclui novos fluxos de trabalho de referência para IA industrial e NVIDIA Omniverse Blueprint para criar visuais imersivos e alimentados por IA. Um fluxo de trabalho de referência para monitoramento remoto 3D de operações industriais será lançado em breve, permitindo que os desenvolvedores conectem modelos 3D fisicamente precisos de sistemas industriais a dados em tempo real do Azure IoT Operations e do Power BI.
PCs RTX AI e computação avançada
A NVIDIA anunciou seu novo SLM multimodal, NVIDIA Nemovision-4B Instruct, para entender imagens visuais no mundo real e na tela. Essa tecnologia, que em breve será introduzida em PCs e estações de trabalho RTX AI, aprimorará as interações humanas digitais com maior realismo.
As atualizações do NVIDIA TensorRT Model Optimizer (ModelOpt) agora oferecem aos desenvolvedores do Windows um caminho aprimorado para otimizar modelos para implantação do ONNX Runtime. Isso permite que os desenvolvedores criem modelos de IA para PCs que são mais rápidos e precisos quando acelerados por GPUs RTX, ao mesmo tempo em que facilitam a implantação no ecossistema de PCs com os runtimes ONNX.
Mais de 600 aplicativos e jogos do Windows executam IA localmente em mais de 100 milhões de PCs GeForce RTX AI no mundo todo, proporcionando desempenho rápido, confiável e de baixa latência. A colaboração entre a NVIDIA e a Microsoft continua a impulsionar a inovação em dispositivos de computação pessoal, trazendo recursos sofisticados de IA para usuários comuns.
Microsoft Cloud e infraestrutura híbrida
O compromisso da Microsoft com soluções multi-cloud e híbridas é exemplificado pelo Azure Arc, que agora atende a mais de 39,000 clientes globalmente. O novo Azure Local oferece infraestrutura híbrida segura conectada à nuvem com opções flexíveis, incluindo servidores GPU para inferência de IA.
A Microsoft também anunciou o Windows Server 2025 e o SQL Server 2025, aproveitando o Azure Arc para fornecer recursos de nuvem em ambientes locais e de nuvem. O SQL Server 2025 se destaca com seus novos recursos de IA integrados, simplificando o desenvolvimento de aplicativos de IA e padrões RAG com suporte a vetores.
Conclusão
As inovações recentes da Microsoft ressaltam sua dedicação ao avanço de silício personalizado, infraestrutura de IA e soluções de nuvem híbrida. Com desenvolvimentos inovadores como o Azure Integrated HSM e o Azure Boost DPU, a Microsoft está definindo um novo modelo para operações de data center seguras, eficientes e de alto desempenho. A introdução de tecnologias de resfriamento e energia de última geração e inovações de código aberto destacam o comprometimento da Microsoft em promover a colaboração e a sustentabilidade do setor.
A evolução da infraestrutura de IA e computação do Azure, incluindo as máquinas virtuais ND H200 V5 e ND GB200 v6, demonstra a capacidade da Microsoft de fornecer desempenho de IA em escala. Enquanto isso, as novas máquinas virtuais HBv5 prometem desempenho para supercomputação baseada em CPU, garantindo que o Azure continue líder em computação de alto desempenho.
Por fim, com os recursos híbridos robustos do Azure Arc e a introdução de ferramentas aprimoradas por IA, como o SQL Server 2025, a Microsoft está equipando as empresas com soluções flexíveis e escaláveis para lidar com as complexidades das cargas de trabalho modernas. Juntos, esses avanços solidificam a posição da Microsoft como líder na condução do futuro da IA, nuvem e infraestrutura híbrida.
Envolva-se com a StorageReview
Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS feed