ArmazenamentoReview.com

Broadcom Tomahawk Ultra Switch visa expansão de IA com Ethernet sem perdas

Empreendimento  ◇  Networking

A Broadcom anunciou oficialmente o envio do Switch Ethernet Tomahawk Ultra, Um produto que redefinirá as redes de computação de alto desempenho (HPC) e inteligência artificial (IA). Projetado para latência ultrabaixa, alta taxa de transferência e operação sem perdas, o Tomahawk Ultra estabelece um novo padrão para comutação Ethernet em ambientes técnicos exigentes.

Broadcom Tomahawk Ultra

Ram Velaga, vice-presidente sênior e gerente geral do Core Switching Group da Broadcom, enfatizou que o Tomahawk Ultra é o resultado de um esforço de engenharia de vários anos envolvendo centenas de especialistas. Este lançamento reforça o compromisso contínuo da Broadcom com o avanço da tecnologia Ethernet para a próxima geração de cargas de trabalho de alto desempenho e orientadas por IA.

Quebrando mitos, redefinindo a Ethernet

Historicamente, a Ethernet tem sido vista como uma tecnologia de alta latência e perdas, inadequada para os clusters de computação mais exigentes. O Tomahawk Ultra desafia essa percepção ao oferecer:

  • Latência ultrabaixa: atinge latência de switch de 250 ns com taxa de transferência total de 51.2 Tbps, permitindo movimentação de dados em tempo real para ambientes de computação fortemente acoplados.
  • Alto desempenho: suporta comutação de taxa de linha até mesmo para os menores pacotes de 64 bytes, processando até 77 bilhões de pacotes por segundo.
  • Cabeçalhos Ethernet otimizados: reduz o tamanho do cabeçalho de 46 bytes para apenas 10 bytes, mantendo total conformidade com Ethernet, aumentando a eficiência da rede e permitindo aprimoramentos específicos de aplicativos.
  • Tecido sem perdas: implementa Link Layer Retry (LLR) e Credit-Based Flow Control (CBFC) para eliminar a perda de pacotes e garantir entrega confiável de dados.

Desenvolvido especificamente para HPC e expansão de IA

O Tomahawk Ultra é otimizado para os padrões de comunicação de baixa latência e alta largura de banda encontrados em sistemas HPC e clusters de IA. Sua arquitetura foi projetada para oferecer desempenho previsível e de alta eficiência para simulações em larga escala, computação científica e treinamento e inferência sincronizados de modelos de IA.

Quando implantado com Scale-Up Ethernet (SUE), o Tomahawk Ultra atinge latência de comunicação XPU para XPU abaixo de 400 ns, incluindo tempo de trânsito do switch, definindo um novo padrão para computação de IA sincronizada em escala.

A redução da sobrecarga do cabeçalho Ethernet de 46 bytes para 10 bytes, mantendo a conformidade, aumenta significativamente a eficiência da rede. Este cabeçalho otimizado e adaptável proporciona flexibilidade e melhorias de desempenho em uma variedade de cargas de trabalho de HPC e IA.

Tecido sem perdas para cargas de trabalho com uso intensivo de dados

A tecnologia de estrutura sem perdas do Tomahawk Ultra foi projetada para evitar perdas de pacotes durante transferências de dados de alto volume. Utilizando LLR, o switch detecta erros de link com Correção de Erros Antecipada (FEC) e retransmite pacotes automaticamente, evitando perdas no nível físico. A CBFC também previne estouros de buffer, uma causa comum de perda de pacotes. Juntos, esses mecanismos criam uma estrutura Ethernet verdadeiramente sem perdas, oferecendo a confiabilidade exigida pelas aplicações com maior uso intensivo de dados da atualidade.

Um gargalo significativo nas cargas de trabalho de IA e aprendizado de máquina é a sobrecarga associada a operações coletivas, como AllReduce, Broadcast e AllGather. O Tomahawk Ultra soluciona esse problema executando essas operações diretamente no chip do switch, reduzindo o tempo de conclusão das tarefas e maximizando a utilização de recursos computacionais caros. Notavelmente, esse recurso opera independentemente dos endpoints, permitindo uma rápida integração entre diversas arquiteturas de sistema e ecossistemas de fornecedores.

Roteamento com reconhecimento de topologia e abertura do ecossistema

O Tomahawk Ultra foi projetado com roteamento avançado e com reconhecimento de topologia para suportar topologias HPC como Dragonfly, Mesh e Torus. O switch está em conformidade com o padrão UEC e aproveita a abertura e o rico ecossistema de redes Ethernet, garantindo ampla compatibilidade e preparação para o futuro em arquiteturas de data center em evolução.

Como parte da estratégia Ethernet-forward da Broadcom para escalonamento de IA, a empresa lançou o SUE-Lite, uma versão otimizada da especificação SUE. O SUE-Lite é adaptado para aplicações aceleradoras sensíveis à potência e à área, mantendo os principais recursos de baixa latência e sem perdas do SUE completo, ao mesmo tempo em que reduz ainda mais a pegada de silício e o consumo de energia das interfaces Ethernet em XPUs e CPUs de IA. Essa abordagem leve simplifica a integração de estruturas Ethernet compatíveis com os padrões em plataformas de IA, promovendo uma adoção mais ampla da Ethernet como a interconexão preferencial para arquiteturas de escalonamento.

Junto com o Tomahawk 102.4 de 6 Tb/s, o Tomahawk Ultra forma a espinha dorsal de uma arquitetura Ethernet unificada, permitindo clusters de treinamento de IA escaláveis e cargas de trabalho HPC e distribuídas expansivas.

Disponibilidade

O switch está atualmente sendo enviado para uso em clusters de treinamento de IA em escala de rack e ambientes de supercomputação.

Envolva-se com a StorageReview

Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS feed

Haroldo Fritts

Estou na indústria de tecnologia desde que a IBM criou a Selectric. Minha formação, porém, é escrever. Então decidi sair do negócio de pré-vendas e voltar às minhas raízes, escrevendo um pouco, mas ainda envolvido com tecnologia.