O servidor em torre Dell PowerEdge T560 foi desenvolvido especificamente para TI local, virtualização, gerenciamento de banco de dados, inferência de IA, nuvem privada e muito mais. Ele é equipado com CPUs escaláveis Intel Xeon de quarta geração e suporta 24 unidades de armazenamento.
O servidor em torre Dell PowerEdge T560 foi desenvolvido especificamente para TI local, virtualização, gerenciamento de banco de dados, inferência de IA, nuvem privada e muito mais. Ele é equipado com CPUs escaláveis Intel Xeon de quarta geração e suporta 24 unidades de armazenamento.
Especificações do servidor em torre Dell PowerEdge T560
Os servidores em rack não são práticos para todas as empresas, especialmente se você não tiver um data center. Isto é duplamente verdadeiro no limite, onde a noção de uma sala de servidores tradicional é inexistente. É aí que entra o servidor em torre PowerEdge T560, com um design adequado para escritório (baixo ruído). O chassi maior também permite algumas configurações exclusivas que não são possíveis em servidores montados em rack, como misturar baias de 2.5″ com baias de 3.5″ no backplane frontal.
O T560 suporta dois processadores escaláveis Intel Xeon de quarta geração de 32 núcleos (“Sapphire Rapids”), 1 TB de memória (16 slots RDIMM) e muitas combinações possíveis de unidades. Nesse sentido, não é uma torre pequena, equivalendo a 4.5U em um rack e suportando oito ventoinhas de resfriamento.
Esta torre também possui muita expansão com seis slots PCIe, dois dos quais são x16 Gen5. Ele acomoda duas GPUs de 300 watts de largura dupla ou seis GPUs de 75 watts de slot único.
As especificações completas do PowerEdge T560 são as seguintes:
Subcontratante | Até dois 4th processadores escaláveis Intel Xeon de última geração, até 32 núcleos por soquete |
Memória |
|
Controladores de estoque |
|
Baias | Baías frontais:
|
Fontes de Alimentação |
|
fãs | Até oito ventoinhas padrão (STD) ou ventoinhas de alto desempenho (HPR) |
Dimensões | Altura — 464.0 mm (18.26 polegadas) (com pés)
Largura — 200.0 mm (7.87 polegadas)
|
Fator de Forma | Servidor em torre 4.5U |
Gerenciamento Integrado |
|
Software OpenManage |
|
Para fornecer mobilidade com contentor (certificado SOC) | OpenManage Mobile |
Integrações OpenManage |
|
Segurança |
|
NIC incorporado | 2 x 1GbE LOM no Planar |
Opções de rede | 1 x cartão OCP x8 3.0
Nota: O sistema permite que LOM na placa planar e OCP sejam instalados no sistema |
Opções de GPU | Até 2 x 300 W DW ou 6 x 75 W SW |
Portas | Frente:
Traseira:
Interno:
|
PCIe | Até seis slots PCIe:
|
Sistema operacional e hipervisores |
|
Construção e design do servidor em torre Dell PowerEdge T560
Os servidores em torre raramente são pequenos e o PowerEdge T560 certamente não é, com 18.3 por 7.9 por 26.7 polegadas (HWD). Esta torre 4.5U é impressionante de todos os ângulos, começando pela frente com seus compartimentos de unidade hot-swap. O nosso tem oito baias de 2.5 e oito baias de 3.5 polegadas, com dois drives BOSS redundantes compatíveis com RAID M.2 à direita.
As portas frontais incluem uma porta USB 2.0, uma USB 3.0 e uma porta iDRAC Direct (Micro-AB USB).
À direita dos compartimentos de unidade de 3.5 polegadas estão as unidades de inicialização NVMe M.2.
Na parte traseira, a torre possui um USB 2.0, um USB 3.0, uma porta serial opcional, 1GbE para iDRAC, uma VGA e duas portas Ethernet e slot OCP. Outra porta USB 3.0 é opcional.
A porta lateral da torre foi removida para acesso interno; o layout se parece muito com um servidor padrão virado de lado. A maior parte do interior é coberta por uma enorme guia de fluxo de ar.
Oito ventiladores hot-swap descem pela linha central; apertar as abas laranja permite que elas se soltem.
Cada CPU Xeon possui um enorme dissipador de calor em estilo torre e é flanqueado por oito slots DIMM. O T560 suporta até 1 TB de RAM total.
Aqui estão as vistas atrás dos compartimentos de unidade, incluindo a placa NVMe RAID, há uma segunda placa nesta construção para os HDDs.
Temos uma configuração excepcional com cinco GPUs NVIDIA L4, tornando-a uma plataforma de inferência ideal.
Imprensado entre as GPUs está outro pequeno escudo de fluxo de ar para a NIC OCP.
As fontes de alimentação duplas hot-swap estão na parte superior.
Veja nosso vídeo explicativo em Instagram.
Desempenho do servidor em torre Dell PowerEdge T560
Nossa unidade de revisão tem a seguinte configuração:
- 2x Intel Xeon Gold 6448Y (32 núcleos/64 threads cada, TDP de 225 watts, 2.1-4.1 GHz)
- 8 SSDs Solidigm P1.6 de 5520 TB com placa RAID PERC 12
- 5 GPUs NVIDIA L4
- 8x RDIMMs de 64 GB
Para testes de armazenamento, aproveitamos os SSDs conectados à placa RAID PERC 12 em configurações JBOD e RAID 6. Isso é diferente de usar NVMe nativo, onde cada SSD teria sua própria conexão x4 com a placa-mãe.
Análise de Carga de Trabalho do VDBench
Quando se trata de dispositivos de armazenamento de comparação, o teste de aplicativo é o melhor e o teste sintético vem em segundo lugar. Embora não sejam uma representação perfeita das cargas de trabalho reais, os testes sintéticos ajudam os dispositivos de armazenamento de linha de base com um fator de repetibilidade que facilita a comparação entre soluções concorrentes. Essas cargas de trabalho oferecem uma variedade de perfis de teste, desde testes de "quatro cantos" e testes comuns de tamanho de transferência de banco de dados até capturas de rastreamento de diferentes ambientes VDI.
Todos esses testes utilizam o gerador de carga de trabalho vdBench comum, com um mecanismo de script para automatizar e capturar resultados em um grande cluster de teste de computação. Isso nos permite repetir as mesmas cargas de trabalho em uma ampla variedade de dispositivos de armazenamento, incluindo arrays flash e dispositivos de armazenamento individuais. Nosso processo de teste para esses benchmarks preenche toda a superfície da unidade com dados e, em seguida, particiona uma seção da unidade igual a 25% da capacidade da unidade para simular como a unidade pode responder às cargas de trabalho do aplicativo. Isso difere dos testes de entropia total, que usam 100 por cento da unidade e os colocam em um estado estável. Como resultado, esses números refletirão velocidades de gravação sustentadas mais altas.
perfis:
- Leitura aleatória em 4K: 100% de leitura, 128 threads, 0-120% de atualização
- Gravação aleatória em 4K: 100% de gravação, 128 threads, 0-120% de atualização
- Leitura sequencial de 64K: 100% de leitura, 32 threads, 0-120% iorado
- Gravação sequencial de 64K: 100% gravação, 16 threads, 0-120% iorado
- Leitura aleatória em 64K: 100% de leitura, 32 threads, 0-120% de atualização
- Gravação aleatória em 64K: 100% de gravação, 16 threads, 0-120% de atualização
- Banco de Dados Sintético: SQL e Oracle
- Clone completo de VDI e rastreamentos de clone vinculados
Começando com a leitura aleatória de 4K, vimos o T560 atingir 1.79 milhão de IOPS em RAID6 e 4.86 milhões de IOPS em JBOD. A latência foi bem controlada, exceto no final dos resultados do JBOD, onde vimos um pequeno aumento.
A gravação aleatória em 4K teve um aumento acentuado no array RAID6; não passou de 415,000 IOPS. A configuração JBOD, por outro lado, atingiu 3.9 milhões de IOPS antes de apresentar pequena instabilidade. Mais uma vez, porém, vemos uma latência relativamente estável até os picos.
A seguir vem a leitura sequencial de 64k; o array RAID560 do T6 atingiu 8.2 GB/s enquanto a configuração JBOD atingiu quase 23 GB/s. As linhas não mostram instabilidade.
Vimos outro aumento acentuado no array RAID560 do T6 no teste de gravação sequencial de 64k, onde atingiu um limite de cerca de 4 GB/s. A configuração JBOD subiu para cerca de 16.5 GB/s, com alguma instabilidade passando de 14 GB/s.
Nosso teste misto 70/30 8K mostrou linhas relativamente suaves; o array RAID6 atingiu cerca de 670,000 IOPS e o array JBOD 1.93 milhão de IOPS. As latências em ambos os casos permaneceram controladas.
Os próximos testes são nossas cargas de trabalho SQL. Continuamos vendo latência estável e aqui não há picos. O array RAID6 atingiu um pico de pouco mais de 4 milhões de IOPS, enquanto a configuração JBOD ultrapassou 14 milhões de IOPS.
Também executamos um teste de carga de trabalho Oracle SQL onde os resultados foram semelhantes, desta vez o array RAID6 ultrapassando 4 milhões de IOPS e a configuração JBOD ultrapassando um pouco mais de 14 milhões de IOPS.
Comparativos de desempenho do Windows Server 2022
Para nossa comparação, selecionamos o R760 testado anteriormente. Aqui está a comparação entre as CPUs. Ambos têm o mesmo número de núcleos, embora as CPUs Xeon 6448Y dentro do T560 tenham uma vantagem na velocidade de clock geral em comparação com os Xeon 6430 dentro do R760.
Dell PowerEdge T560-Intel Xeon 6448Y | Dell PowerEdge R760 – Intel Xeon 6430 | |
---|---|---|
Núcleos totais | 32 | 32 |
Total de Tópicos | 64 | 64 |
Freqüência turbo máxima | 4.10 GHz | 3.40 GHz |
Frequência básica do processador | 2.10 GHz | 2.10 GHz |
Cinebench R23 e R24
O Cinebench R23 da Maxon é um benchmark de renderização de CPU que utiliza todos os núcleos e threads da CPU. Nós o executamos para testes multi e single-core. Pontuações mais altas são melhores.
Com o recente lançamento da versão 24, introduziu um novo sistema de pontuação e a capacidade de rodar em múltiplas GPUs.
Teste | Dell PowerEdge T560 (2 x Xeon Gold 6448Y) |
---|---|
Cinebench R23 Multi | 73,622 |
Cinebench R23 Individual | 1186 |
Cinebench R24 GPU | 97,984 |
Cinebench R24 CPU múltipla | 3,976 |
Cinebench R24 CPU única | 3,976 |
CLI do Liquidificador
O benchmark do Blender mede o desempenho de renderização 3D de uma CPU ou GPU renderizando uma cena 3D no software Blender. Ele fornece uma pontuação que pode ser usada para comparar o desempenho de diferentes sistemas e componentes. Os números estão em amostras por minuto.
Teste | Dell PowerEdge T560 (2x Xeon Gold 6448Y, 5x NVIDIA L4) | Dell PowerEdge R760 (2x Xeon Gold 6430, 1x NVIDIA A2) |
---|---|---|
CPU Blender CLI – Monstro | 582.085675 | 576.928413 |
CPU Blender CLI – Junkshop | 383.546707 | 376.557690 |
CPU Blender CLI – Sala de aula | 275.857847 | 281.536442 |
GPU Blender CLI – Monstro | 2,547.287378 | 479.238127 |
GPU Blender CLI – Junkshop | 1,348.087892 | 302.355378 |
GPU Blender CLI – Sala de aula | 1,229.122455 | 248.540754 |
Geekbench 6
Geekbench é um benchmark multiplataforma. Usamos o benchmark de CPU, que possui múltiplas cargas de trabalho para modelar tarefas e aplicativos do mundo real.
Teste | Dell PowerEdge T560 (2 x Xeon Gold 6448Y) | Dell PowerEdge R760 (2 x Xeon Gold 6430) |
---|---|---|
Pontuação múltipla de CPU Geekbench 6 | 18,572 | 12,971 |
Pontuação única de CPU do Geekbench 6 | 1,734 | 12,971 |
Pontuação dGPU da GPU Geekbench 6 – OpenCL | 157,380 | Não testado |
triturador de y
y-cruncher é um programa multi-threaded e escalável que pode calcular Pi e outras constantes matemáticas para trilhões de dígitos. Desde o seu lançamento em 2009, tornou-se um aplicativo popular de benchmarking e teste de estresse para overclockers e entusiastas de hardware. Aqui, novamente, vemos que os chips Xeon Gold do PowerEdge R760 têm uma ligeira vantagem de desempenho.
Teste | Dell PowerEdge T560 (2 x Xeon Gold 6448Y) | Dell PowerEdge R760 (2 x Xeon Gold 6430) |
---|---|---|
y-cruncher 1b Tempo de cálculo | 7.332 | 7.306 |
y-cruncher 2.5b Tempo de cálculo | 20.102 | |
y-cruncher 10b Tempo de cálculo | 97.32 | 91.435 |
GPUPI
GPUPI 3.3.3 é uma versão do utilitário de benchmarking leve projetado para calcular π (pi) em bilhões de decimais usando aceleração de hardware por meio de GPUs e CPUs. Ele aproveita o poder de computação do OpenCL e CUDA, que inclui unidades de processamento central e gráfico. Executamos CUDA nos 5x L4.
Solicitações | Dell PowerEdge T560 (2x Xeon Gold 6448Y) com 5X NVIDIA L4 |
---|---|
GPUPI v3.3-1B | 0seg 850ms |
GPUPI v3.3-32B | 50seg 361ms |
Inferência UL Procyon AI (CPU)
ULs Inferência Procyon AI O conjunto de benchmark testa o desempenho de vários mecanismos de inferência de IA usando redes neurais de última geração. Executamos esses testes apenas na CPU. Os números abaixo são tempos médios de inferência; a pontuação geral é a última linha.
Teste | Dell PowerEdge T560 (2 x Xeon Gold 6448Y) | Dell PowerEdge R760 (2 x Xeon Gold 6430) |
---|---|---|
MobileNet V3 | 2.60 | 3.05 |
ResNet 50 | 6.12 | 6.79 |
Inception V4 | 19.59 | 20.55 |
DeepLab V3 | 23.68 | 31.27 |
YOLO V3 | 29.63 | 32.58 |
REAL-ESRGAN | 1468.64 | 1498.36 |
Pontuação geral | 191 | 169 |
GROMACS CUDA no servidor em torre Dell T560
Para desbloquear todo o potencial do servidor em torre Dell T560 equipado com cinco GPUs NVIDIA L5, fornecemos o GROMACS compilado, um software de dinâmica molecular, especificamente para CUDA. Esta compilação personalizada deveria aproveitar os recursos de processamento paralelo das 4 GPUs NVIDIA L5, essenciais para acelerar simulações computacionais.
O processo envolveu a utilização do nvcc, o compilador CUDA da NVIDIA, juntamente com muitas iterações dos sinalizadores de otimização apropriados para garantir que os binários fossem devidamente ajustados à arquitetura do servidor. A inclusão do suporte CUDA na compilação GROMACS permite que o software faça interface direta com o hardware da GPU, o que pode melhorar drasticamente os tempos de computação para simulações complexas.
O teste: interação de proteínas personalizadas em Gromacs
Aproveitando um arquivo de entrada fornecido pela comunidade de nosso diverso Discord, que continha parâmetros e estruturas adaptadas para um estudo específico de interação de proteínas, iniciamos uma simulação de dinâmica molecular. Os resultados foram notáveis: o sistema atingiu uma taxa de simulação de 170.268 nanossegundos por dia.
GPU | System | ns/dia | tempo(s) principal(ais) |
---|---|---|---|
Nvidia A4000 | Caixa branca AMD Ryzen 5950x | 84.415 | 163,763 |
RTX NVIDIA 4070 | Caixa branca AMD Ryzen 7950x3d | 131.85 | 209,692.3 |
5x NVIDIA L4 | Dell T560 com 2x Intel Xeon Gold 6448Y | 170.268 | 608,912.7 |
Significado da velocidade de simulação
A velocidade com que as simulações moleculares podem ser executadas é crítica em vários setores. Por exemplo, na indústria farmacêutica, as capacidades de simulação rápida podem acelerar significativamente a descoberta de medicamentos, permitindo aos investigadores iterar rapidamente através de designs e interações moleculares.
Nas ciências dos materiais, pode acelerar o desenvolvimento de novos materiais com propriedades desejadas. A taxa de 170.268 ns/dia implica que simulações que levariam quase duas semanas em servidores muito mais antigos agora podem ser concluídas em apenas um dia no Dell T560 equipado com o modesto NVIDIA L4. Isto não só aumenta a produtividade, mas também abre novas fronteiras na análise de dados e na tomada de decisões em tempo real.
A saída de simulação GROMACS do T560
Impacto na pesquisa científica
Uma interação com um laboratório que atualmente executa simulações semelhantes em hardware com 10 anos de idade proporcionou um forte contraste. A configuração existente leva 24 horas para concluir o que o Dell T560 pode realizar em poucos minutos. Esta comparação não apenas destaca os avanços nos processadores modernos, mas também mostra o valor que o hardware atual pode trazer para a pesquisa científica.
Com o servidor em torre Dell T560, os pesquisadores puderam realizar mais experimentos em um período de tempo mais curto, melhorando o ciclo iterativo de hipóteses e testes que é fundamental para o avanço científico. Isso significa que experimentos computacionais que antes eram considerados intensivos em recursos para exploração de rotina agora são viáveis.
Aplicações de IA de desempenho computacional
O desempenho computacional demonstrado pelo Dell T560 tem implicações de amplo alcance no campo da pesquisa. Não se trata apenas de velocidade, mas também da complexidade e dimensão dos problemas que agora podem ser resolvidos. Simulações em grande escala que modelam sistemas biológicos inteiros, reações químicas complexas ou mesmo modelos ecológicos tornam-se mais viáveis com este tipo de poder computacional.
Com o advento da IA e do aprendizado de máquina, o alto rendimento das simulações de dinâmica molecular permite a geração de enormes conjuntos de dados necessários para o treinamento de modelos sofisticados. Esses modelos podem levar a avanços na biologia preditiva, novos materiais e química computacional de próxima geração.
Conclusão
A torre Dell PowerEdge T560 oferece flexibilidade notável para uso geral de servidores e tarefas avançadas ou especializadas, incluindo GPU, computação e ciência de dados. Ele iguala e, de certa forma, excede os servidores em rack em expansão e potência, com dois processadores escaláveis Intel “Sapphire Rapids” Xeon, 1 TB de RAM, muitas configurações de unidade de armazenamento e suporte a múltiplas GPUs, mas seu formato de torre não requer um centro de dados. Embora claramente não seja silencioso dependendo da carga de trabalho, seus ventiladores são silenciosos o suficiente para serem usados em um ambiente de escritório.
Nossos testes abrangeram todas as áreas dos recursos do PowerEdge T560; ele mostrou números sólidos em nossos testes de armazenamento e CPU e mostrou sua força nos testes de GPU com nossa configuração excepcional de cinco GPUs NVIDIA L4. Também apreciamos a facilidade de manutenção da torre. Para expansão e adaptabilidade louváveis até mesmo às cargas de trabalho de IA mais exigentes, a Torre PowerEdge T560 recebe nossa forte recomendação e reconhecimento como vencedora do “Melhor de 2023”.
Envolva-se com a StorageReview
Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS feed