A Intel lançou seus processadores escalonáveis Intel Xeon de 4ª geração (Sapphire Rapids), a CPU Intel Xeon Max Series (Sapphire Rapids HBM) e a Intel Data Center GPU Max Series (Ponte Vecchio). Eles são desenvolvidos especificamente para melhorar o desempenho, a eficiência, a segurança e os recursos do data center para IA, computação em nuvem, redes, computação de borda e supercomputadores. A Intel está fazendo parceria com os clientes para oferecer soluções e sistemas personalizados usando os novos produtos para atender às necessidades de computação em escala.
A Intel lançou seus processadores escalonáveis Intel Xeon de 4ª geração (Sapphire Rapids), a CPU Intel Xeon Max Series (Sapphire Rapids HBM) e a Intel Data Center GPU Max Series (Ponte Vecchio). Eles são desenvolvidos especificamente para melhorar o desempenho, a eficiência, a segurança e os recursos do data center para IA, computação em nuvem, redes, computação de borda e supercomputadores. A Intel está fazendo parceria com os clientes para oferecer soluções e sistemas personalizados usando os novos produtos para atender às necessidades de computação em escala.
Existem atualmente mais de 100 milhões de processadores individuais Xeon em uso em todo o mundo. Por que eles são tão populares? Bem, eles estão disponíveis em várias configurações e são projetados para serem escaláveis, permitindo que sejam usados em uma ampla gama de aplicativos e ambientes. Eles também podem ser personalizados para cargas de trabalho ou aplicativos específicos, oferecem uma variedade de recursos de segurança para ajudar a proteger contra ameaças como malware e violações de dados e são altamente eficientes em termos de energia.
Modelos de CPU escalável Intel Xeon de 4ª geração
Os novos modelos Xeon estão disponíveis em seis categorias, incluindo Max 9400, Platinum 8000, Gold 6000, Gold 5000, Silver 4000 e Bronze 3000, bem como a série Max. Cada série tem uma variedade de modelos diferentes que podem ser detalhados para o caso de uso de destino:
- Uso geral de desempenho
- Uso geral da linha principal
- Resfriamento líquido de uso geral
- Uso geral de soquete único (Série “Q”)
- Uso de longa duração (IoT) para uso geral (Série “T”)
- IMDB/Analytics/virtualização otimizada (Série “H”)
- 5G/Rede otimizada (Série “N”)
- IaaS otimizado para nuvem (séries “P”, “V” e “M”)
- Armazenamento e infraestrutura hiperconvergente otimizados (série “S”)
- HPC otimizado (ou seja, a série Intel Xeon CPU Max)
Por exemplo, o poderoso Platinum 8400 Os processadores são projetados para análise avançada de dados, IA e datacenters de nuvem híbrida, oferecendo alto desempenho, recursos de plataforma e aceleração de carga de trabalho, bem como segurança aprimorada baseada em hardware e processamento de vários soquetes. Esses processadores também oferecem até 60 núcleos por processador (um aumento de 20 núcleos em comparação com os principais Modelo Xeon de 3ª geração), oito canais de memória e aceleração AI com Intel AMX.
Intel Xeon Gold 6400 e Ouro 5400 os processadores são otimizados para cargas de trabalho de centro de dados e multinuvem. Eles oferecem maior velocidade de memória, capacidade, segurança e aceleração de carga de trabalho. Intel Xeon Silver 4400 os processadores fornecem desempenho essencial, velocidade de memória aprimorada e eficiência de energia para computação, rede e armazenamento de data center de nível básico.
Aqui está um resumo detalhado de cada CPU Xeon e seu caso de uso específico:
Recursos | Processadores escaláveis Intel Xeon de 4ª geração | CPU Intel Xeon Série Max | |
Contagem extrema de núcleos (XCC) | Contagem média de núcleos (MCC) | Memória de alta largura de banda (HBM) | |
Matriz de construção |
Quatro ladrilhos conectados usando MDF sobre Intel Embedded Multi-die Interconnect Bridge (EMIB) |
Um chip monolítico |
Quatro ladrilhos conectados usando MDF sobre Intel Embedded Multi-die Interconnect Bridge (EMIB) |
Contagem de núcleo | Até 60 núcleos ativos | Até 32 núcleos ativos | Até 56 núcleos ativos |
Faixa TDP | 225 a 350W | 125 a 350W | 350W |
Memória |
DDR5 @ 4800 (1 DPC), 4400 (2DPC), 16 Gb DRAM, 8 Canais
Intel Optane PMem 300 (Crow Pass) @4400 MT/s |
DDR5 @ 4800 (1 DPC), 4400 (2DPC), 8 canais
Memória HBM64e de 2 GB com até 1.14 GB/núcleo |
|
Intel UPI | UPI 2.0 a 16 GT/s, até 4 Ultra Path Interconnects | UPI 2.0 a 16 GT/s, até 3 Ultra Path Interconnects | UPI 2.0 a 16 GT/s, até 4 Ultra Path Interconnects |
Escalabilidade | 1 Soquete, 2 Soquetes, 4 Soquetes, 8 Soquetes | 1 tomada, 2 tomadas, 4 tomadas | 1 soquete, 2 soquete |
Link PCIe/Compute Express | PCIe 5.0 (80 pistas),
Até 4 dispositivos suportados via Compute Express Link (CXL) 1.1 |
||
Segurança | intel sgx
Tamanho mínimo do Enclave Page Cache (EPC) 256 MB |
Intel SGX (somente modo plano) | |
Aceleradores IP integrados | Intel QAT, DLB, IAA, DSA (até 4 dispositivos cada) | Intel QAT, DLB (até 2 dispositivos cada), Intel DSA, IAA (1 dispositivo cada) | DSA Intel (4 dispositivos) |
Os processadores escaláveis Intel Xeon de 4ª geração visam melhorar o desempenho e enfrentar vários desafios de computação relacionados a IA, análise, rede, segurança, armazenamento e computação de alto desempenho (HPC). Esses processadores são notáveis por terem os aceleradores mais integrados de qualquer CPU.
De acordo com a Intel, os clientes do Intel Xeon Scalable de 4ª geração podem esperar uma melhoria média de desempenho no seguinte:
- 9x a melhoria na eficiência por watt ao usar aceleradores integrados,
- Economia de energia de 70 watts por CPU no modo de energia otimizado com perda mínima de desempenho,
- Redução de XNUMX% no custo total de propriedade e no consumo de energia em comparação com as gerações anteriores.
4ª Geração Intel Xeon Escalável – Eficiência de Energia Aprimorada
O novo modo de energia otimizado pode fornecer até 20% de economia de energia de soquete com menos de 5% de impacto no desempenho para cargas de trabalho específicas. Inovações em resfriamento a ar e líquido podem reduzir ainda mais o consumo total de energia do data center.
As CPUs escaláveis Intel Xeon de 4ª geração são equipadas com um grande número de aceleradores integrados, que podem ajudar a economizar energia no nível da plataforma e reduzir a necessidade de aceleração adicional. Isso pode ajudar seus clientes a atingirem suas metas de sustentabilidade. Além disso, espera-se que o recém-introduzido Modo de Energia Otimizado forneça até 20% de economia de energia de soquete com impacto mínimo no desempenho de cargas de trabalho específicas.
Inovações em resfriamento a ar e líquido podem reduzir ainda mais o consumo total de energia do data center. Os processadores Xeon de 4ª geração também foram fabricados usando 90% ou mais de eletricidade renovável nas instalações da Intel com recursos avançados de recuperação de água.
Novos avanços no desempenho da IA
Em comparação com a geração anterior, os processadores Xeon de 4ª geração são cotados para atingir um desempenho de treinamento e inferência em tempo real PyTorch até 10 vezes maior com o uso de seus aceleradores Advanced Matrix Extension (Intel AMX),
PyTorch é uma estrutura de aprendizado de máquina para construir e treinar redes neurais. A inferência em tempo real envolve o uso de um modelo de rede neural treinado para fazer previsões ou decisões em tempo real com base em novos dados de entrada. Maior desempenho de treinamento e inferência em tempo real do PyTorch é essencial para processadores Intel porque permite que eles executem cargas de trabalho de aprendizado de máquina que envolvem previsão em tempo real ou tomada de decisões com mais eficiência.
Isso é especialmente útil em aplicações em que previsões ou decisões rápidas e precisas são fundamentais. Além disso, maior desempenho em tarefas de aprendizado de máquina pode levar a um treinamento mais rápido de modelos e previsões mais precisas, bem como a capacidade de usar modelos maiores e mais complexos.
Como tal, a Intel diz que seus novos processadores Intel Xeon Scalable de 4ª geração podem fornecer ainda mais recursos para processamento de linguagem natural, reivindicando uma velocidade de até 20 vezes em modelos de linguagem grande.
O pacote de software de IA da Intel, testado com mais de 400 modelos de IA de aprendizado de máquina e aprendizado profundo em vários setores e aplicativos, pode ser usado com a ferramenta de IA preferida do desenvolvedor para aumentar a produtividade e acelerar o desenvolvimento de IA. A suíte foi projetada para ser portátil, permitindo que seja usada na estação de trabalho e implantada na borda e na nuvem.
Capacidades de rede
Os processadores escaláveis Intel Xeon de 4ª geração também oferecem modelos especificamente otimizados para redes de alto desempenho e baixa latência e cargas de trabalho de ponta. Esses processadores desempenham um papel crucial na condução de um futuro mais definido por software para setores como telecomunicações, varejo, manufatura e cidades inteligentes. Para cargas de trabalho de núcleo 5G, os aceleradores integrados podem ajudar a aumentar a taxa de transferência e diminuir a latência, enquanto as melhorias no gerenciamento de energia aprimoram a capacidade de resposta e a eficiência da plataforma.
Eles também podem dobrar a capacidade da rede virtualizada de acesso por rádio (vRAN) em comparação com 3rdProcessadores Xeon de última geração (sem consumir mais energia). Em geral, os processadores com maior capacidade de vRAN podem lidar com o tráfego de dados de rede de maneira mais eficiente e eficaz, como reduzir a latência e melhorar o desempenho geral. Isso é particularmente importante para aplicativos que requerem comunicação em tempo real.
A Intel indica que isso permitirá que os provedores de serviços de comunicação dobrem seu desempenho por watt e atendam às suas necessidades de desempenho e eficiência energética. O aumento no vRAN também permitiria que as organizações expandissem ou reduzissem mais facilmente à medida que o número de cargas de trabalho do vRAN mudasse, o que significa maior flexibilidade nos recursos de rede (por exemplo, sem a necessidade de hardware, energia ou infraestrutura adicionais).
HPC

Lâmina de computação (chassi aberto) no laboratório Intel HPC
Os produtos Intel Xeon Scalable e Intel Max Series de 4ª geração oferecem uma arquitetura escalável e balanceada que combina CPU e GPU com o ecossistema de software aberto oneAPI para cargas de trabalho de computação exigentes em HPC e AI. A Intel afirma que esta arquitetura foi projetada especificamente para lidar com os problemas mais difíceis do mundo atual.
O software aberto OneAPI é um conjunto de ferramentas e bibliotecas que permitem aos desenvolvedores escrever códigos que podem ser executados em várias plataformas de hardware (incluindo CPUs, GPUs e outros processadores especializados) usando um único conjunto de interfaces de programação. Isso pode facilitar o desenvolvimento e a otimização de aplicativos para diversos ambientes de computação.

Blade de computação no laboratório Intel HPC
Na Jones Farm da Intel, a StorageReview deu uma olhada nos bastidores da Borealis. A Intel, a HPE e o Argonne National Laboratory estão trabalhando para entregar o supercomputador Aurora, que será implementado com as novas plataformas de GPU Xeon e Datacenter de 4ª geração anunciadas hoje.
Borealis é um mini-sistema de dois racks localizado no laboratório Jones Farm em Oregon que valida o sistema Aurora e suas novas tecnologias. Ele tem a mesma arquitetura e design do Aurora e está sendo testado para validar todos os componentes do software e dos sistemas de refrigeração líquida antes que o sistema seja instalado em larga escala no Argonne National Laboratory.

Sistema de resfriamento a água: gerente de laboratório do Jones Farm HPC Lab – Borealis mostra os tubos vermelhos e azuis que fazem parte do sistema de resfriamento a água para manter os racks resfriados.
A série Intel Xeon CPU/GPU Max
O Intel Xeon CPU Max Series é o primeiro processador x86 com memória de alta largura de banda a chegar ao mercado, permitindo acelerar muitas cargas de trabalho HPC sem exigir alterações de código. A empresa chama o Intel Data Center GPU Max Series como seu processador de maior densidade, que estará disponível em vários fatores de forma para atender a uma variedade de necessidades do cliente.
O Xeon CPU Max Series oferece 64 GB de memória de alta largura de banda no pacote, o que aumenta significativamente a taxa de transferência de dados para cargas de trabalho de HPC e AI. Em comparação com os processadores Intel Xeon Scalable de 3ª geração de última geração, o Xeon CPU Max Series oferece até 3.7 vezes mais desempenho em vários aplicativos do mundo real, como modelagem de sistemas de energia e terra. A largura de banda da CPU é essencial para cargas de trabalho de HPC e IA, pois geralmente exigem que uma grande quantidade de dados seja processada e movida entre a CPU e a memória. Caso contrário, pode causar gargalos no desempenho do sistema e levar a tempos de processamento mais longos.
O Data Center GPU Max Series, que apresenta mais de 100 bilhões de transistores em um pacote de 47 blocos, aumenta a taxa de transferência para cargas de trabalho que envolvem física, serviços financeiros e ciências biológicas. Quando combinada com a CPU Xeon Max Series, a plataforma pode atingir um desempenho até 12.8 vezes maior do que a geração anterior ao executar o simulador de dinâmica molecular LAMMPS (Large-scale Atomic/Molecular Massively Parallel Simulator) de código aberto.
A Intel lançou o Série GPU Flex para data centers em agosto de 2022, uma placa baseada em Xe HPG com até 16 (8 por GPU) núcleos X, 16 TFLOPS e capacidade de memória de 16 GB.
Intel sob demanda
O Intel On-Demand é um serviço que permite aos clientes expandir ou atualizar os aceleradores e recursos aprimorados de hardware disponíveis na maioria dos processadores escalonáveis Intel Xeon de 4ª geração. O serviço é gerenciado pela Intel e pelos fornecedores de hardware e consiste em uma API para solicitação de licenças e um agente de software para provisionamento e ativação de licenças.
Os clientes podem optar por comprar recursos sob demanda no momento da compra ou como uma atualização pós-compra, e a Intel também está trabalhando em um modelo de adoção de medição no qual os recursos podem ser ativados e desativados conforme necessário e o pagamento é baseado em uso. A introdução do modelo de ativação com processadores Xeon de 4ª geração permite que os clientes escolham SKUs premium com todos os recursos ou adicionem recursos a qualquer momento durante o ciclo de vida do processador.
Os provedores iniciais de On-Demand incluem H3C, Inspur, Lenovo, Supermicro e Variscale, com a Intel trabalhando com provedores adicionais em seus planos de capacitação.
DRM em nível de chip, ou gerenciamento de direitos digitais, refere-se à tecnologia que controla o acesso a determinados recursos ou capacidades do chip de computador. No contexto do Intel On-Demand, o DRM no nível do chip pode potencialmente ser usado para restringir o acesso a determinados recursos ou capacidades dos processadores Intel Xeon Scalable de 4ª geração, a menos que adquiridos ou ativados por meio do serviço On-Demand. Isso pode afetar o direito de reparo, pois pode tornar mais difícil para indivíduos ou oficinas de reparo independentes acessar e reparar certos aspectos de sistemas equipados com Intel On-Demand.
A sustentabilidade ambiental é uma consideração importante quando se trata do uso e descarte de produtos de tecnologia, incluindo CPUs corporativas. Embora o Intel On-Demand possa permitir que os clientes expandam ou atualizem os recursos de seus processadores, não está claro como esse serviço pode impactar a sustentabilidade ambiental dos produtos. Como o TDP do pacote não muda com a ativação, pode ser necessário levar em consideração o consumo de energia dos recursos não utilizados e o potencial de aumento de lixo eletrônico devido a atualizações ou substituições. É crucial para empresas como a Intel considerar os impactos ambientais de seus produtos e serviços e trabalhar em busca de soluções mais sustentáveis.
Desempenho escalável Intel Xeon de 4ª geração Ensaios
A ênfase do processador Intel Xeon Scalable de 4ª geração na melhoria da eficiência se destaca em alguns de nossos primeiros benchmarks. Esses novos processadores são anunciados como alcançando um aumento de eficiência de 53% (para computação de uso geral) em relação aos processadores escalonáveis Xeon de 3ª geração por meio de refinamentos de fabricação aprimorados e em cargas de trabalho direcionadas, desempenho médio de 2.9x por watt de melhoria de eficiência utilizando aceleradores integrados.
Além dessas melhorias, os chips de nível intermediário de nova geração são tão poderosos quanto os modelos de nível superior de última geração, tornando-os uma opção econômica para operadores de data center. Esses chips intermediários podem ajudar os datacenters a otimizar seus custos e obter melhor eficiência geral, oferecendo desempenho semelhante aos modelos principais por um preço mais baixo.
Tínhamos algumas opções para testar o desempenho do Sapphire Rapids e, para mostrar as melhorias de eficiência, testamos uma plataforma intermediária de 4ª geração com Xeons duplos 8454Y (US$ 3,995) e comparamos com uma plataforma top de linha de 3ª geração com CPUs duplas 8380 (US$ 9,400). Com as novas melhorias da 4ª Geração, nosso sistema de médio porte foi capaz de acompanhar os benchmarks do modelo carro-chefe da geração anterior.
Cinebench | ||
2 x 4ª geração 8452Y (2.0 GHz x 36) | 2 x 3ª geração 8380 (2.3 GHz x 40) | |
Multi-Core | 60075 | 70540 |
Single Core | 841 | 985 |
Núcleo Multiplicador | 71.40x | 71.63x |
Benchmark de renderização da CLI do Blender | ||
2 x 4ª geração 8452Y (2.0 GHz x 36) | 2 x 3ª geração 8380 (2.3 GHz x 40) | |
Monstro | 652.526942 | 671.145395 |
sucata | 401.119468 | 407.141514 |
Sala de aula | 308.802541 | 320.507039 |
Total | 1362.448951 | 1398.793948 |
Além disso, em um teste interno de treinamento de modelo de IA, observamos um aumento aproximado de 5% no desempenho, medindo 95 minutos para 3 de 8380ª geração versus 90 minutos para 4Y de 8452ª geração.
No geral, as melhorias na eficiência oferecidas pelos processadores Intel Xeon Scalable de 4ª geração os tornam uma opção atraente para operadores de data centers que buscam reduzir o consumo de energia e os custos. Os processadores de uso geral oferecem um excelente equilíbrio entre desempenho e eficiência, tornando-os uma escolha sólida para uma ampla gama de cargas de trabalho. Estamos entusiasmados para testar aceleradores específicos em cargas de trabalho de data center, incluindo o Data Storage Accelerator.
Impacto no mercado
Com Processadores Intel Xeon Scalable de 4ª geração finalmente enviados para a empresa, os provedores de nuvem os têm há algum tempo, a batalha continua com Processadores AMD Genoa no centro de dados. Embora em alto nível, é realmente fácil olhar para a enorme contagem de pistas PCI de Gênova e declará-los vencedores. Mas selecionar a CPU certa hoje em dia é muito mais complicado do que isso. Há um equilíbrio delicado de custo, energia, desempenho e qualificação com componentes adicionais no sistema. Ah, e não vamos negligenciar a importância de entender a carga de trabalho para alinhá-la com a CPU correta.
Portanto, hoje não há uma resposta fácil para a questão de quem é melhor, Gênova ou Sapphire Rapids. Isso levará tempo para acontecer, pois Dell, HPE, Supermicro, Lenovo e outros trazem sistemas para o mercado. Com a adoção de novos fatores de forma SSD acontecendo agora em servidores, suporte para taxa de transferência Gen5 e novas opções de rede e acelerador de alta velocidade, como DPUs, o jogo está em andamento. Esta não é, no entanto, uma batalha das folhas de especificações. A responsabilidade recai sobre a organização de TI da empresa de ser tão diligente e informada quanto possível para garantir que esteja investindo em sistemas que suportem adequadamente suas necessidades de aplicativos. E esse pode ser o maior desafio de todos. Com tantas opções, parceiros de TI sofisticados podem ser mais críticos agora do que nunca.
Envolva-se com a StorageReview
Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS feed