Home Empreendimento Análise do servidor em torre Dell PowerEdge T560

Análise do servidor em torre Dell PowerEdge T560

by Charles P. Jefferies
Torre Dell PowerEdge T560 - Interior

O servidor em torre Dell PowerEdge T560 foi desenvolvido especificamente para TI local, virtualização, gerenciamento de banco de dados, inferência de IA, nuvem privada e muito mais. Ele é equipado com CPUs escaláveis ​​Intel Xeon de quarta geração e suporta 24 unidades de armazenamento.

O servidor em torre Dell PowerEdge T560 foi desenvolvido especificamente para TI local, virtualização, gerenciamento de banco de dados, inferência de IA, nuvem privada e muito mais. Ele é equipado com CPUs escaláveis ​​Intel Xeon de quarta geração e suporta 24 unidades de armazenamento.

Torre Dell PowerEdge T560

Especificações do servidor em torre Dell PowerEdge T560

Os servidores em rack não são práticos para todas as empresas, especialmente se você não tiver um data center. Isto é duplamente verdadeiro no limite, onde a noção de uma sala de servidores tradicional é inexistente. É aí que entra o servidor em torre PowerEdge T560, com um design adequado para escritório (baixo ruído). O chassi maior também permite algumas configurações exclusivas que não são possíveis em servidores montados em rack, como misturar baias de 2.5″ com baias de 3.5″ no backplane frontal.

O T560 suporta dois processadores escaláveis ​​Intel Xeon de quarta geração de 32 núcleos (“Sapphire Rapids”), 1 TB de memória (16 slots RDIMM) e muitas combinações possíveis de unidades. Nesse sentido, não é uma torre pequena, equivalendo a 4.5U em um rack e suportando oito ventoinhas de resfriamento.

Esta torre também possui muita expansão com seis slots PCIe, dois dos quais são x16 Gen5. Ele acomoda duas GPUs de 300 watts de largura dupla ou seis GPUs de 75 watts de slot único.

As especificações completas do PowerEdge T560 são as seguintes:

Subcontratante Até dois 4th processadores escaláveis ​​Intel Xeon de última geração, até 32 núcleos por soquete
Memória
  • 16 slots DIMM DDR5, máximo de 1 TB
  • Somente DIMMs ECC DDR5 registrados
Controladores de estoque
  • PERC interno: fPERC H965i, fPERC H755N, fPERC H755, fPERC H355, fPERC HBA355i
  • Inicialização interna: Subsistema de armazenamento otimizado para inicialização (BOSS-N1): HWRAID 2 unidades SSD M.2 NVMe ou USB
  • HBA externo (não RAID): PERC HBA355e
  • RAID de software: S160 (somente para unidades NVMe)
Baias Baías frontais:

  • PERC interno: fPERC H965i, fPERC H755N, fPERC H755, fPERC H355, fPERC HBA355i
  • Inicialização interna: Subsistema de armazenamento otimizado para inicialização (BOSS-N1): HWRAID 2 unidades SSD M.2 NVMe ou USB
  • HBA externo (não RAID): PERC HBA355e
  • RAID de software: S160 (somente para unidades NVMe)
Fontes de Alimentação
  • 2400 W Platinum 100—240 VCA ou 2400 W 240 VCC, redundante hot swap
  • 1800 W Titanium 200—240 VCA ou 1800 W 240 VCC, hot swap redundante
  • 1400 W Platinum 100—240 VCA ou 1400 W 240 VCC, redundante hot swap
  • 1100 W Titanium 100—240 VCA ou 1100 W 240 VCC, hot swap redundante
  • 1100 LVDC -48 — (-60) VDC, troca a quente redundante
  • 800 W Platinum 100—240 VCA ou 800 W 240 VCC, redundante hot swap
  • 700 W Titanium 200—240 VCA ou 700 W 240 VCC, hot swap redundante
  • 600 W Platinum 100—240 VCA ou 600 W 240 VCC, redundante hot swap
fãs Até oito ventoinhas padrão (STD) ou ventoinhas de alto desempenho (HPR)
Dimensões Altura — 464.0 mm (18.26 polegadas) (com pés)

  •  508.8 mm (20.03 polegadas) (com rodas giratórias)
  •  446.0 mm (17.60 polegadas) (sem pés)

Largura — 200.0 mm (7.87 polegadas)

  • Profundidade — 678.2 mm (26.70 polegadas) (com moldura)
  •  660.6 mm (26 polegadas) (sem moldura)
Fator de Forma Servidor em torre 4.5U
Gerenciamento Integrado
  • iDRAC9
  • iDRAC direto
  • API iDRAC RESTful com Redfish
  • Módulo de serviço iDRAC
  • Módulo sem fio Quick Sync 2
Software OpenManage
  • OpenManage Enterprise
  • Plug-in OpenManage Power Manager
  • Plug-in do Serviço OpenManage
  • Plug-in OpenManage Update Manager
  • Plug-in do CloudIQ para PowerEdge
  • Integração OpenManage Enterprise para VMware vCenter
  • Integração OpenManage para Microsoft System Center
  • Integração do OpenManage com o Windows Admin Center
Para fornecer mobilidade com contentor (certificado SOC) OpenManage Mobile
Integrações OpenManage
  • BMC Visão Verdadeira
  • Microsoft System Center
  • Integração OpenManage com ServiceNow
  • Módulos Red Hat Ansible
  • Provedores Terraform
  • VMware vCenter e vRealize Operations Manage
Segurança
  • Firmware assinado criptograficamente
  • Criptografia de dados em repouso (SEDs com gerenciamento de chave local ou externa)
  • seguro Bota
  • Secure Erase
  • Verificação de componentes protegidos (verificação de integridade de hardware)
  • Raiz de confiança de silício
  • Bloqueio do sistema (requer iDRAC9 Enterprise ou Datacenter)
  • TPM 2.0 FIPS, certificado CC-TCG, TPM 2.0 China NationZ
NIC incorporado 2 x 1GbE LOM no Planar
Opções de rede 1 x cartão OCP x8 3.0

Nota: O sistema permite que LOM na placa planar e OCP sejam instalados no sistema

Opções de GPU Até 2 x 300 W DW ou 6 x 75 W SW
Portas Frente:

  • 1 x USB 2.0
  • 1 x USB 3.0
  • 1 porta iDRAC Direct (Micro-AB USB)

Traseira:

  • 1 x USB 2.0
  • 1 x USB 3.0
  • 1 x porta serial (opcional)
  • 1 x porta iDRAC dedicada (RJ45)
  • 1 porta VGA
  • 2 x portas Ethernet

Interno:

  • USB 3.0 (opcional)
PCIe Até seis slots PCIe:

  • Slot 1: x16 Gen5 Altura total, Comprimento total
  • Slot 2: x16 Gen5 Altura total, Comprimento total
  • Slot 3: x16 Gen4 Altura total, Meio comprimento
  • Slot 4: x16 Gen4 Altura total, Meio comprimento
  • Slot 5: x16 (x8 pistas) Gen4 Altura total, Meio comprimento
  • Slot 6: x16 Gen4 Altura total, Meio comprimento
Sistema operacional e hipervisores
  • Servidor Ubuntu LTS canônico
  • Microsoft Windows Server com Hyper-V
  • Red Hat Enterprise Linux
  • Servidor SUSE Linux Enterprise
  • VMware ESXi
  • Para especificações e detalhes de interoperabilidade, consulte Dell.com/OSsupport

Construção e design do servidor em torre Dell PowerEdge T560

Os servidores em torre raramente são pequenos e o PowerEdge T560 certamente não é, com 18.3 por 7.9 por 26.7 polegadas (HWD). Esta torre 4.5U é impressionante de todos os ângulos, começando pela frente com seus compartimentos de unidade hot-swap. O nosso tem oito baias de 2.5 e oito baias de 3.5 polegadas, com dois drives BOSS redundantes compatíveis com RAID M.2 à direita.

As portas frontais incluem uma porta USB 2.0, uma USB 3.0 e uma porta iDRAC Direct (Micro-AB USB).

Torre Dell PowerEdge T560 - frontal

À direita dos compartimentos de unidade de 3.5 polegadas estão as unidades de inicialização NVMe M.2.

Torre Dell PowerEdge T560 - Unidades de inicialização M.2

Na parte traseira, a torre possui um USB 2.0, um USB 3.0, uma porta serial opcional, 1GbE para iDRAC, uma VGA e duas portas Ethernet e slot OCP. Outra porta USB 3.0 é opcional.

Torre Dell PowerEdge T560 - Traseira

A porta lateral da torre foi removida para acesso interno; o layout se parece muito com um servidor padrão virado de lado. A maior parte do interior é coberta por uma enorme guia de fluxo de ar.

Torre Dell PowerEdge T560 - Interior

Oito ventiladores hot-swap descem pela linha central; apertar as abas laranja permite que elas se soltem.

Torre Dell PowerEdge T560 - Ventiladores

Cada CPU Xeon possui um enorme dissipador de calor em estilo torre e é flanqueado por oito slots DIMM. O T560 suporta até 1 TB de RAM total.

Torre Dell PowerEdge T560 - CPUs

Aqui estão as vistas atrás dos compartimentos de unidade, incluindo a placa NVMe RAID, há uma segunda placa nesta construção para os HDDs.

Torre Dell PowerEdge T560 - Compartimentos de unidade

Torre Dell PowerEdge T560 - Placa RAID

Temos uma configuração excepcional com cinco GPUs NVIDIA L4, tornando-a uma plataforma de inferência ideal.

Torre Dell PowerEdge T560 - Nvidia L4s

Imprensado entre as GPUs está outro pequeno escudo de fluxo de ar para a NIC OCP.

Torre Dell PowerEdge T560 - NIC OCP

As fontes de alimentação duplas hot-swap estão na parte superior.

Torre Dell PowerEdge T560 – Fontes de alimentação

Veja nosso vídeo explicativo em Instagram.

Desempenho do servidor em torre Dell PowerEdge T560

Nossa unidade de revisão tem a seguinte configuração:

  • 2x Intel Xeon Gold 6448Y (32 núcleos/64 threads cada, TDP de 225 watts, 2.1-4.1 GHz)
  • 8 SSDs Solidigm P1.6 de 5520 TB com placa RAID PERC 12
  • 5 GPUs NVIDIA L4
  • 8x RDIMMs de 64 GB

Para testes de armazenamento, aproveitamos os SSDs conectados à placa RAID PERC 12 em configurações JBOD e RAID 6. Isso é diferente de usar NVMe nativo, onde cada SSD teria sua própria conexão x4 com a placa-mãe.

Análise de Carga de Trabalho do VDBench

Quando se trata de dispositivos de armazenamento de comparação, o teste de aplicativo é o melhor e o teste sintético vem em segundo lugar. Embora não sejam uma representação perfeita das cargas de trabalho reais, os testes sintéticos ajudam os dispositivos de armazenamento de linha de base com um fator de repetibilidade que facilita a comparação entre soluções concorrentes. Essas cargas de trabalho oferecem uma variedade de perfis de teste, desde testes de "quatro cantos" e testes comuns de tamanho de transferência de banco de dados até capturas de rastreamento de diferentes ambientes VDI.

Todos esses testes utilizam o gerador de carga de trabalho vdBench comum, com um mecanismo de script para automatizar e capturar resultados em um grande cluster de teste de computação. Isso nos permite repetir as mesmas cargas de trabalho em uma ampla variedade de dispositivos de armazenamento, incluindo arrays flash e dispositivos de armazenamento individuais. Nosso processo de teste para esses benchmarks preenche toda a superfície da unidade com dados e, em seguida, particiona uma seção da unidade igual a 25% da capacidade da unidade para simular como a unidade pode responder às cargas de trabalho do aplicativo. Isso difere dos testes de entropia total, que usam 100 por cento da unidade e os colocam em um estado estável. Como resultado, esses números refletirão velocidades de gravação sustentadas mais altas.

perfis:

  • Leitura aleatória em 4K: 100% de leitura, 128 threads, 0-120% de atualização
  • Gravação aleatória em 4K: 100% de gravação, 128 threads, 0-120% de atualização
  • Leitura sequencial de 64K: 100% de leitura, 32 threads, 0-120% iorado
  • Gravação sequencial de 64K: 100% gravação, 16 threads, 0-120% iorado
  • Leitura aleatória em 64K: 100% de leitura, 32 threads, 0-120% de atualização
  • Gravação aleatória em 64K: 100% de gravação, 16 threads, 0-120% de atualização
  • Banco de Dados Sintético: SQL e Oracle
  • Clone completo de VDI e rastreamentos de clone vinculados

Começando com a leitura aleatória de 4K, vimos o T560 atingir 1.79 milhão de IOPS em RAID6 e 4.86 ​​milhões de IOPS em JBOD. A latência foi bem controlada, exceto no final dos resultados do JBOD, onde vimos um pequeno aumento.

Leitura aleatória Dell PowerEdge T560 4K

A gravação aleatória em 4K teve um aumento acentuado no array RAID6; não passou de 415,000 IOPS. A configuração JBOD, por outro lado, atingiu 3.9 milhões de IOPS antes de apresentar pequena instabilidade. Mais uma vez, porém, vemos uma latência relativamente estável até os picos.

Dell PowerEdge T560 gravação aleatória 4K

A seguir vem a leitura sequencial de 64k; o array RAID560 do T6 atingiu 8.2 GB/s enquanto a configuração JBOD atingiu quase 23 GB/s. As linhas não mostram instabilidade.

Leitura sequencial Dell PowerEdge T560 64kVimos outro aumento acentuado no array RAID560 do T6 no teste de gravação sequencial de 64k, onde atingiu um limite de cerca de 4 GB/s. A configuração JBOD subiu para cerca de 16.5 GB/s, com alguma instabilidade passando de 14 GB/s.

Gravação sequencial Dell PowerEdge T560 64k

Nosso teste misto 70/30 8K mostrou linhas relativamente suaves; o array RAID6 atingiu cerca de 670,000 IOPS e o array JBOD 1.93 milhão de IOPS. As latências em ambos os casos permaneceram controladas.

Dell PowerEdge T560 Misto 70/30 8K

Os próximos testes são nossas cargas de trabalho SQL. Continuamos vendo latência estável e aqui não há picos. O array RAID6 atingiu um pico de pouco mais de 4 milhões de IOPS, enquanto a configuração JBOD ultrapassou 14 milhões de IOPS.

Carga de trabalho SQL do Dell PowerEdge T560

Também executamos um teste de carga de trabalho Oracle SQL onde os resultados foram semelhantes, desta vez o array RAID6 ultrapassando 4 milhões de IOPS e a configuração JBOD ultrapassando um pouco mais de 14 milhões de IOPS.

Carga de trabalho Oracle Dell PowerEdge T560

Comparativos de desempenho do Windows Server 2022

Para nossa comparação, selecionamos o R760 testado anteriormente. Aqui está a comparação entre as CPUs. Ambos têm o mesmo número de núcleos, embora as CPUs Xeon 6448Y dentro do T560 tenham uma vantagem na velocidade de clock geral em comparação com os Xeon 6430 dentro do R760.

Dell PowerEdge T560-Intel Xeon 6448Y Dell PowerEdge R760 – Intel Xeon 6430
Núcleos totais 32 32
Total de Tópicos 64 64
Freqüência turbo máxima 4.10 GHz 3.40 GHz
Frequência básica do processador 2.10 GHz 2.10 GHz

Cinebench R23 e R24

O Cinebench R23 da Maxon é um benchmark de renderização de CPU que utiliza todos os núcleos e threads da CPU. Nós o executamos para testes multi e single-core. Pontuações mais altas são melhores.

Com o recente lançamento da versão 24, introduziu um novo sistema de pontuação e a capacidade de rodar em múltiplas GPUs.

Teste Dell PowerEdge T560 (2 x Xeon Gold 6448Y)
Cinebench R23 Multi 73,622
Cinebench R23 Individual 1186
Cinebench R24 GPU 97,984
Cinebench R24 CPU múltipla 3,976
Cinebench R24 CPU única 3,976

CLI do Liquidificador

O benchmark do Blender mede o desempenho de renderização 3D de uma CPU ou GPU renderizando uma cena 3D no software Blender. Ele fornece uma pontuação que pode ser usada para comparar o desempenho de diferentes sistemas e componentes. Os números estão em amostras por minuto.

Teste Dell PowerEdge T560 (2x Xeon Gold 6448Y, 5x NVIDIA L4) Dell PowerEdge R760 (2x Xeon Gold 6430, 1x NVIDIA A2)
CPU Blender CLI – Monstro 582.085675 576.928413
CPU Blender CLI – Junkshop 383.546707 376.557690
CPU Blender CLI – Sala de aula 275.857847 281.536442
GPU Blender CLI – Monstro 2,547.287378 479.238127
GPU Blender CLI – Junkshop 1,348.087892 302.355378
GPU Blender CLI – Sala de aula 1,229.122455 248.540754

Geekbench 6

Geekbench é um benchmark multiplataforma. Usamos o benchmark de CPU, que possui múltiplas cargas de trabalho para modelar tarefas e aplicativos do mundo real.

Teste Dell PowerEdge T560 (2 x Xeon Gold 6448Y) Dell PowerEdge R760 (2 x Xeon Gold 6430)
Pontuação múltipla de CPU Geekbench 6 18,572 12,971
Pontuação única de CPU do Geekbench 6 1,734 12,971
Pontuação dGPU da GPU Geekbench 6 – OpenCL 157,380 Não testado

triturador de y

y-cruncher é um programa multi-threaded e escalável que pode calcular Pi e outras constantes matemáticas para trilhões de dígitos. Desde o seu lançamento em 2009, tornou-se um aplicativo popular de benchmarking e teste de estresse para overclockers e entusiastas de hardware. Aqui, novamente, vemos que os chips Xeon Gold do PowerEdge R760 têm uma ligeira vantagem de desempenho.

Teste Dell PowerEdge T560 (2 x Xeon Gold 6448Y) Dell PowerEdge R760 (2 x Xeon Gold 6430)
y-cruncher 1b Tempo de cálculo 7.332 7.306
y-cruncher 2.5b Tempo de cálculo 20.102
y-cruncher 10b Tempo de cálculo 97.32 91.435

GPUPI

GPUPI 3.3.3 é uma versão do utilitário de benchmarking leve projetado para calcular π (pi) em bilhões de decimais usando aceleração de hardware por meio de GPUs e CPUs. Ele aproveita o poder de computação do OpenCL e CUDA, que inclui unidades de processamento central e gráfico. Executamos CUDA nos 5x L4.

Solicitações Dell PowerEdge T560 (2x Xeon Gold 6448Y) com 5X NVIDIA L4
GPUPI v3.3-1B 0seg 850ms
GPUPI v3.3-32B 50seg 361ms

Inferência UL Procyon AI (CPU)

ULs Inferência Procyon AI O conjunto de benchmark testa o desempenho de vários mecanismos de inferência de IA usando redes neurais de última geração. Executamos esses testes apenas na CPU. Os números abaixo são tempos médios de inferência; a pontuação geral é a última linha.

Teste Dell PowerEdge T560 (2 x Xeon Gold 6448Y) Dell PowerEdge R760 (2 x Xeon Gold 6430)
MobileNet V3 2.60 3.05
ResNet 50 6.12 6.79
Inception V4 19.59 20.55
DeepLab V3 23.68 31.27
YOLO V3 29.63 32.58
REAL-ESRGAN 1468.64 1498.36
Pontuação geral 191 169

GROMACS CUDA no servidor em torre Dell T560

Para desbloquear todo o potencial do servidor em torre Dell T560 equipado com cinco GPUs NVIDIA L5, fornecemos o GROMACS compilado, um software de dinâmica molecular, especificamente para CUDA. Esta compilação personalizada deveria aproveitar os recursos de processamento paralelo das 4 GPUs NVIDIA L5, essenciais para acelerar simulações computacionais.

O processo envolveu a utilização do nvcc, o compilador CUDA da NVIDIA, juntamente com muitas iterações dos sinalizadores de otimização apropriados para garantir que os binários fossem devidamente ajustados à arquitetura do servidor. A inclusão do suporte CUDA na compilação GROMACS permite que o software faça interface direta com o hardware da GPU, o que pode melhorar drasticamente os tempos de computação para simulações complexas.

O teste: interação de proteínas personalizadas em Gromacs

Aproveitando um arquivo de entrada fornecido pela comunidade de nosso diverso Discord, que continha parâmetros e estruturas adaptadas para um estudo específico de interação de proteínas, iniciamos uma simulação de dinâmica molecular. Os resultados foram notáveis: o sistema atingiu uma taxa de simulação de 170.268 nanossegundos por dia.

GPU System ns/dia tempo(s) principal(ais)
Nvidia A4000 Caixa branca AMD Ryzen 5950x 84.415 163,763
RTX NVIDIA 4070 Caixa branca AMD Ryzen 7950x3d 131.85 209,692.3
5x NVIDIA L4 Dell T560 com 2x Intel Xeon Gold 6448Y 170.268 608,912.7

Significado da velocidade de simulação

A velocidade com que as simulações moleculares podem ser executadas é crítica em vários setores. Por exemplo, na indústria farmacêutica, as capacidades de simulação rápida podem acelerar significativamente a descoberta de medicamentos, permitindo aos investigadores iterar rapidamente através de designs e interações moleculares.

Nas ciências dos materiais, pode acelerar o desenvolvimento de novos materiais com propriedades desejadas. A taxa de 170.268 ns/dia implica que simulações que levariam quase duas semanas em servidores muito mais antigos agora podem ser concluídas em apenas um dia no Dell T560 equipado com o modesto NVIDIA L4. Isto não só aumenta a produtividade, mas também abre novas fronteiras na análise de dados e na tomada de decisões em tempo real.

A saída de simulação GROMACS do T560

Impacto na pesquisa científica

Uma interação com um laboratório que atualmente executa simulações semelhantes em hardware com 10 anos de idade proporcionou um forte contraste. A configuração existente leva 24 horas para concluir o que o Dell T560 pode realizar em poucos minutos. Esta comparação não apenas destaca os avanços nos processadores modernos, mas também mostra o valor que o hardware atual pode trazer para a pesquisa científica.

DALL·E 2023-11-03 15.08.18 - Foto representando uma simulação computacional de alta potência de dinâmica molecular com foco em GROMACS. A imagem mostra uma estrutura molecular 3D complexa

Com o servidor em torre Dell T560, os pesquisadores puderam realizar mais experimentos em um período de tempo mais curto, melhorando o ciclo iterativo de hipóteses e testes que é fundamental para o avanço científico. Isso significa que experimentos computacionais que antes eram considerados intensivos em recursos para exploração de rotina agora são viáveis.

Aplicações de IA de desempenho computacional

O desempenho computacional demonstrado pelo Dell T560 tem implicações de amplo alcance no campo da pesquisa. Não se trata apenas de velocidade, mas também da complexidade e dimensão dos problemas que agora podem ser resolvidos. Simulações em grande escala que modelam sistemas biológicos inteiros, reações químicas complexas ou mesmo modelos ecológicos tornam-se mais viáveis ​​com este tipo de poder computacional.

Com o advento da IA ​​e do aprendizado de máquina, o alto rendimento das simulações de dinâmica molecular permite a geração de enormes conjuntos de dados necessários para o treinamento de modelos sofisticados. Esses modelos podem levar a avanços na biologia preditiva, novos materiais e química computacional de próxima geração.

Conclusão

A torre Dell PowerEdge T560 oferece flexibilidade notável para uso geral de servidores e tarefas avançadas ou especializadas, incluindo GPU, computação e ciência de dados. Ele iguala e, de certa forma, excede os servidores em rack em expansão e potência, com dois processadores escaláveis ​​Intel “Sapphire Rapids” Xeon, 1 TB de RAM, muitas configurações de unidade de armazenamento e suporte a múltiplas GPUs, mas seu formato de torre não requer um centro de dados. Embora claramente não seja silencioso dependendo da carga de trabalho, seus ventiladores são silenciosos o suficiente para serem usados ​​em um ambiente de escritório.

Torre Dell PowerEdge T560 - Nvidia L4s

Nossos testes abrangeram todas as áreas dos recursos do PowerEdge T560; ele mostrou números sólidos em nossos testes de armazenamento e CPU e mostrou sua força nos testes de GPU com nossa configuração excepcional de cinco GPUs NVIDIA L4. Também apreciamos a facilidade de manutenção da torre. Para expansão e adaptabilidade louváveis ​​até mesmo às cargas de trabalho de IA mais exigentes, a Torre PowerEdge T560 recebe nossa forte recomendação e reconhecimento como vencedora do “Melhor de 2023”.

Configurador T560

Envolva-se com a StorageReview

Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS feed