Home Empreendimento Desempenho de armazenamento Intel – Windows Server

Desempenho de armazenamento Intel – Windows Server

by Brian Beeler
Desempenho de armazenamento Intel no Windows Server

Na semana passada, a Intel lançou seu Processadores Xeon de 3ª Geração, que se baseia em seu jogo de ecossistema que inclui armazenamento Optane SSD no P5800X e claro o mais recente Módulos de memória persistente da série 200 (PMem). Com nossas análises iniciais de armazenamento Intel, decidimos redirecionar o servidor Intel e a tecnologia de armazenamento que temos no laboratório. Instalamos o Windows Server 2019 para testar Optane PMem 200, Optane P5800X SSD e TLC NAND SSD P5510 cabeça a cabeça. O objetivo desta revisão é avaliar o desempenho do armazenamento Intel no Windows Server para que possamos entender melhor onde estão os pontos fortes de cada uma dessas tecnologias em um cenário bare metal.

Na semana passada, a Intel lançou seu Processadores Xeon de 3ª Geração, que se baseia em seu jogo de ecossistema que inclui armazenamento Optane SSD no P5800X e claro o mais recente Módulos de memória persistente da série 200 (PMem). Com nossas análises iniciais de armazenamento Intel, decidimos redirecionar o servidor Intel e a tecnologia de armazenamento que temos no laboratório. Instalamos o Windows Server 2019 para testar Optane PMem 200, Optane P5800X SSD e TLC NAND SSD P5510 cabeça a cabeça. O objetivo desta revisão é avaliar o desempenho do armazenamento Intel no Windows Server para que possamos entender melhor onde estão os pontos fortes de cada uma dessas tecnologias em um cenário bare metal.

Desempenho de armazenamento Intel no Windows Server

Optane PMem x Optane SSD x NAND SSD

Ainda há uma série de dúvidas sobre qual tecnologia de armazenamento é a certa para um determinado aplicativo ou caso de uso, apesar da pirâmide de armazenamento há muito favorecida da Intel. Claro, a DRAM é a mais rápida, mas infelizmente também é cara. O Optane PMem pode ser usado como DRAM, fornecendo armazenamento persistente que não precisa de reidratação na reinicialização. O PMem também aproveita os slots DIMM tradicionais, por isso é fácil de usar. O PMem também possui um perfil de desempenho impressionante quando comparado aos SSDs tradicionais.

Pirâmide de Dados Intel

Então, é claro, você tem os SSDs Optane, que foram otimizados para absorver gravações, uma tarefa com a qual os SSDs tradicionais podem ter dificuldade. É por isso que eles são normalmente usados ​​como parte de uma arquitetura de armazenamento multicamadas como cache ou pool de camadas. Os SSDs Optane, embora sejam mais caros que os SSDs TLC NAND e tenham uma tremenda desvantagem de capacidade, o P5800X atinge o máximo de 1.6 TB, por exemplo.

Descendo a linha, temos SSDs TLC, como o Intel P5510, que se encaixa no ponto ideal para desempenho por dólar. Por fim, no reino do flash, temos os SSDs QLC. Eles oferecem a maior capacidade e valor por terabyte, mas realmente preferem estar em um ambiente de leitura pesada, ainda melhor se estiverem atrás de um cache ou camada que agrega gravações e as entrega aos SSDs QLC de maneira gentil e amorosa. A partir daí, a pirâmide de armazenamento se transforma em um pântano de discos rígidos, unidades de fita e permutações de armazenamento em nuvem.

Banco de memória persistente Intel Optane série 200

Desempenho de armazenamento Intel no Windows Server

Para avaliar o desempenho dessas tecnologias de armazenamento Intel mais recentes, queríamos uma situação com o mínimo de sobrecarga possível, ao mesmo tempo em que encontramos um bom suporte para PMem especificamente e nossa metodologia de teste existente. O primeiro candidato é o Microsoft Windows Server 2019. Estamos testando em um servidor Intel OEM que foi projetado para apresentar as tecnologias de plataforma mais recentes, como Xeon de 3ª geração, PMem 200 e o suporte para armazenamento PCIe Gen4.

Especificações do servidor OEM Intel

  • 2 x Intel Xeon Platinum 8380 @ 2.3 GHz 40 núcleos
  • 16x32GB DDR4 3200MHz
  • 16 x 128 GB de memória persistente Intel série 200
  • SSD de inicialização: Intel 1 TB SATA
  • SO: Windows Server 2019

Análise de Carga de Trabalho Sintética Corporativa

Nosso processo de benchmark de armazenamento compartilhado corporativo pré-condiciona cada dispositivo em estado estacionário com a mesma carga de trabalho com a qual o dispositivo será testado sob uma carga pesada de 16 threads com uma fila pendente de 16 por thread e, em seguida, testado em intervalos definidos em vários threads/filas perfis de profundidade para mostrar desempenho sob uso leve e pesado. Como estamos testando um pequeno espaço de armazenamento de 20% em cada dispositivo, apenas representamos graficamente as seções principais de cada teste.

Testes de pré-condicionamento e estado estacionário primário:

  • Rendimento (Agregado de IOPS de Leitura+Gravação)
  • Latência média (latência de leitura+gravação calculada em conjunto)
  • Latência máxima (latência máxima de leitura ou gravação)
  • Desvio padrão de latência (desvio padrão de leitura + gravação calculado em conjunto)

Nossa Enterprise Synthetic Workload Analysis inclui quatro perfis baseados em tarefas do mundo real, com uma carga de trabalho 1T/1T 4K para focar no baixo desempenho de carga. Esses perfis foram desenvolvidos para facilitar a comparação com nossos benchmarks anteriores, bem como valores amplamente publicados, como velocidade máxima de leitura e gravação de 4k e 8k 70/30, que é comumente usado para unidades corporativas.

  • 4K 1T/1T
    • 100% de leitura ou 100% de gravação
    • 100% 4K
  • 4K 16T/16T
    • 100% de leitura ou 100% de gravação
    • 100% 4K
  • 8K 70/30
    • 70% de leitura, 30% de gravação
    • 100% 8K
  • 8K (Sequencial)
    • 100% de leitura ou 100% de gravação
    • 100% 8K
  • 128K (Sequencial)
    • 100% de leitura ou 100% de gravação
    • 100% 128K

Para nossos testes, analisamos três configurações de armazenamento dentro da plataforma de servidor Intel 3rd Gen. Estes incluíram o seguinte:

  • 16 x 128 GB Intel Persistent Memory 200 Series em dois namespaces (cada um com cerca de 1 TB de armazenamento)
  • 2 SSDs Intel P800X Optane de 5800 GB
  • 8 SSDs Intel P7.68 de 5510 TB

Cada grupo de dispositivos ou namespace foi testado diretamente com um trabalho FIO, usando 20% da capacidade do dispositivo para medir o desempenho sustentado. Cada dispositivo por grupo recebeu seu próprio trabalho e os resultados foram agregados. Por exemplo, para dois dispositivos sendo testados, cada um recebeu uma carga de trabalho de 1 T/1 T, portanto, dois encadeamentos em 1 fila no total para essa carga de trabalho. Oito dispositivos seriam oito threads totais em uma fila e assim por diante.

Em nosso primeiro teste, nos concentramos em uma carga de trabalho de leitura e gravação aleatória de 4K de profundidade de fila única e thread único. O desempenho off-line é importante para muitos aplicativos, pois alguns dispositivos não precisam de uma grande profundidade de fila de E/S atrás deles para brilhar.

O Intel PMem mostrou vantagens significativas no desempenho de leitura, medindo quase o dobro em comparação com SSDs Intel P5800X duplos ou oito SSDs Intel P5510. Olhando para o desempenho de gravação, o PMem ainda tinha uma vantagem sobre os SSDs P5800X, mas oito unidades P5510 foram capazes de fornecer maior taxa de transferência.

Em seguida, analisamos o impacto da latência média de nosso teste de leitura e gravação 1T/1T 4K.

O Intel PMem mediu 10 microssegundos de latência em leitura aleatória de 4K, seguido pelo P5800X com 24 microssegundos e os SSDs P5510 com 81 microssegundos. Observando a latência de gravação, vimos 11 microssegundos do PMem, 23 dos SSDs P5800x e 27ms dos SSDs P5510.

Passando para uma forma mais pesada do mesmo teste de leitura e gravação em 4K, observamos onde cada tipo de dispositivo atingiu o máximo.

O grupo de oito SSDs Intel P5510 ofereceu a maior taxa de transferência de leitura, medindo quase 4.8 milhões de IOPS, seguido pelo PMem com 3.2 milhões de IOPS e os dois SSDs P5800X com 1.7 milhão de IOPS. Na gravação aleatória de 4K, os dois SSDs P5800X ficaram na liderança com 1.91M IOPS, seguidos pelos oito SSDs P5510 com 1.78M IOPS e os dois namespaces PMem com 1.35M IOPS.

Embora a taxa de transferência seja importante, um dos aspectos mais interessantes do Optane, tanto como PMem quanto como SSD, é como ele lida com a latência de armazenamento. Vemos isso também em nossa carga de trabalho de leitura e gravação aleatória de 4K mais pesada.

O Intel PMem teve a menor latência de leitura medindo 159 microssegundos, seguido pelos dois SSDs P5800X com 296 microssegundos e os oito SSDs P5510 na parte traseira com 427 microssegundos. A latência de gravação teve os dois SSDs P5800X na liderança com 265 microssegundos, com PMem atrás com 377 microssegundos e os oito SSDs P5510 tradicionais com 1.147ms.

Subindo o tamanho do bloco para nossa carga de trabalho 8K 70/30, examinamos os três tipos de armazenamento diferentes e como eles respondem a uma contagem cada vez maior de encadeamentos e filas.

Em termos de desempenho máximo, o grupo de oito SSDs Intel P5510 realmente esticou as pernas e ofereceu alguns números de pico impressionantes. No topo, ele atingiu o máximo com 4.34M IOPS em 16T/16Q, embora o interessante seja ver onde o PMem e os dois P5800X foram capazes de avançar um pouco em alguns dos pontos de encadeamento e fila inferiores.

 

Mudando o foco para a latência média, vemos uma imagem diferente pintada nos diferentes tipos de armazenamento. O Intel PMem, embora não tenha a taxa de transferência mais alta, conseguiu se destacar com algumas das latências médias mais baixas neste teste, seguido de perto pelos SSDs P5800X. Os oito SSDs P5510 em um nível de latência muito mais alto (relativamente) do que as duas tecnologias Optane, embora tenham oferecido a taxa de transferência mais alta de longe.

Em seguida, passamos para nossas cargas de trabalho sequenciais, começando primeiro com nosso tamanho de transferência de 8K.

O grupo de oito SSDs Intel P5510 superou facilmente este teste com 4.45M IOPS, seguido pelo PMem com 1.92M IOPS, seguido pelos dois SSDs P5800X com 1.71M IOPS. Na gravação, o PMem ficou no topo com 1.75M IOPS, seguido pelos oito SSDs P5510 com 1.55M IOPS seguidos pelos dois SSDs P5800X com 1.18M IOPS.

Em nosso último teste, analisamos a largura de banda máxima dos três meios de armazenamento diferentes. Com ambos os tipos de dispositivos U.2, alguns dos recursos limitados vêm do número de pistas para cada implantação.

Começando no topo em largura de banda de leitura, os oito P5510 chegaram com impressionantes 54 GB/s, seguidos pelo PMem com dois namespaces oferecendo 44 GB/s e os dois SSDs P5800X atrás com leitura de 14 GB/s. É interessante ver o quão alto o PMem pode ir quando se trata de largura de banda. Mudando para gravação em bloco grande, os oito SSDs P5510 ficaram no topo com 32.7 GB/s, seguidos pelo PMem com 14.3 GB/s e, em seguida, os dois SSDs P5800X com 11.1 GB/s. No geral, números muito impressionantes em todos os aspectos.

Conclusão

A Intel tem trabalhado arduamente com a Optane nos últimos anos com as variantes PMem e SSD. É claro que essa tecnologia de armazenamento é fundamentalmente importante para eles, pois eles tecem uma história abrangente da plataforma Intel em um esforço para afastar a AMD no data center. E para cargas de trabalho de missão crítica, os resultados confirmam isso. Para armazenamento em camadas, o P5800X fica perfeitamente no topo da hierarquia de dispositivos NVMe, obtendo um aumento gigantesco no desempenho em relação ao modelo da geração anterior, graças em grande parte ao PCIe Gen4. Esse aumento é tão grande que começa a se aproximar do throughput, mas não da largura de banda, oferecido pelo PMem.

Ao longo de nossos testes, vimos exatamente o que esperávamos ver. O PMem mostrou um valor de desempenho tremendo quando se trata de latência e taxa de transferência em profundidades de fila baixas. Ele também oferece enormes ganhos de largura de banda no desempenho de leitura. O SSD P5800X Optane, mesmo em implantações de dois, começa a ficar muito próximo do PMem em geral. Isso permite que o P5800X seja um emparelhamento fantástico com unidades TLC ou QLC em uma solução que pode aproveitá-las como cache ou camada.

Não importa onde olhamos para a plataforma Intel Gen3 Xeon, há muito o que amar quando se trata de armazenamento. Nossas descobertas são destacadas pela imensa largura de banda de leitura do PMem, chegando a 44 GB/s de leitura e latência de 10 microssegundos em cargas de trabalho de leitura e gravação aleatórias de 4K com baixa profundidade de fila. O P5800X oferece benefícios de latência semelhantes, com um alcance mais amplo no compartimento U.2 mais comum, medindo aproximadamente o dobro da latência do Intel PMem em filas e contagens de threads baixas. Até mesmo os SSDs P5510 mostraram sua força quando se tratava de cargas de trabalho de fila mais alta, oferecendo números no topo do gráfico em benchmarks sequenciais ou aleatórios de E/S.

O resultado final é que a última rodada de dispositivos de armazenamento da Intel, tanto PMem quanto SSDs, fizeram avanços substanciais quando comparados aos produtos da geração anterior. Isso é especialmente verdadeiro agora que a Intel é capaz de fornecer o BUS mais rápido para DRAM e os slots PCIe Gen4. Com esses dados bare metal, podemos ver os pontos específicos onde cada tecnologia se destaca. Entender esses dados permitirá que os criadores de sistemas projetem de forma inteligente plataformas que podem fazer qualquer aplicativo se destacar.

Armazenamento Intel Enterprise

Envolva-se com a StorageReview

Newsletter | YouTube | LinkedIn | Instagram | Twitter | Facebook | TikTokRSS feed