A infraestrutura hiperconvergente (HCI) ganhou popularidade pela simplicidade de implantação e gerenciamento. Para aqueles no mundo do Hyper-V, o HCI é consumido por meio do Azure Stack HCI. A boa notícia aqui é que a Microsoft continuou a fornecer recursos ao Azure Stack HCI. Recursos como suporte para Azure Kubernetes Service (AKS) permitem uma experiência de nuvem híbrida flexível. No lado do hardware, a versão Xeon Scalable de 3ª Geração da Intel significa um aumento de desempenho generoso para os nós Azure Stack HCI. Para ajudar as organizações a aproveitar todos esses avanços, a DataON lançou uma série de novos Sistemas Integrados AZS.
A infraestrutura hiperconvergente (HCI) ganhou popularidade pela simplicidade de implantação e gerenciamento. Para aqueles no mundo do Hyper-V, o HCI é consumido por meio do Azure Stack HCI. A boa notícia aqui é que a Microsoft continuou a fornecer recursos ao Azure Stack HCI. Recursos como suporte para Azure Kubernetes Service (AKS) permitem uma experiência de nuvem híbrida flexível. No lado do hardware, a versão Xeon Scalable de 3ª Geração da Intel significa um aumento de desempenho generoso para os nós Azure Stack HCI. Para ajudar as organizações a aproveitar todos esses avanços, a DataON lançou uma série de novos Sistemas Integrados AZS.
Analisamos os sistemas DataON várias vezes ao longo dos anos. Deles Sistema baseado em Optane ganhou nosso prêmio Editor's Choice há dois anos. Também demos uma olhada em seus dois nós Sistema pesado QLC que levou o flash econômico ao limite. O que há de novo desta vez é uma atualização tecnológica graças à Intel e um novo software que traz o que costumávamos pensar como Ready Nodes para Azure Stack HCI, um novo modelo de sistema integrado que aproxima o DataON do nível da Dell e da Lenovo.
DataON Sistemas Integrados
Então, o que faz um Sistema Integrado? No caso do DataON, começamos com o servidor Intel, que o DataON solicita sob demanda conforme os pedidos dos clientes chegam. Esses sistemas mostram o DataON totalmente configurado, com as CPUs, DRAM e rede Intel Xeon de 3ª geração apropriadas. Do lado do armazenamento, o DataON suporta toda a pilha de armazenamento da Intel, incluindo o popular P5510, SSD P5316 QLC, Optano P5800X SSDs e PMem. Para aqueles que buscam soluções híbridas, a DataON também oferece suporte a HDD.
Uma vez no laboratório, os engenheiros da DataON instalam e configuram o sistema operacional Azure Stack HCI, que é fundamentalmente novo e diferente do passado, onde o Azure Stack HCI era mais um recurso no Windows Server. O DataON executa um burn-in para garantir que todos os componentes do sistema estejam funcionando e funcionando conforme o esperado. Para saber mais sobre o novo sistema operacional e o hardware, confira podcast #86 com Howard Lo.
DataON não para por aí. Há muito tempo eles oferecem um plug-in gratuito para Windows Admin Center (WAC) chamado MUST, que fornece gerenciamento, monitoramento e alertas para clusters DataON HCI. Agora eles têm o MUST Pro, que é capaz de fazer tudo o que o MUST faz, além de manter os Sistemas Integrados atualizados com os últimos firmwares e drivers validados. Agora, em uma única interface, os clientes podem atualizar seu software Microsoft, junto com os principais drivers e atualizações de firmware para os servidores e outros componentes. Kevin fez um mergulho profundo no MUST Pro com Henry Fu quando estivemos recentemente no local.
Uma última observação sobre os Sistemas Integrados é que eles também incluem um novo mecanismo de ticket de suporte. Isso une melhor as equipes de suporte da Microsoft e da DataON para que trabalhem em um sistema de tíquetes comum. Isso significa que, quando os clientes ligam para a DataON ou para a Microsoft, os engenheiros de ambas as equipes podem passar informações para resolver o problema. O suporte para sistemas como esse é uma reclamação comum entre os clientes que se cansam de apontar o dedo. Com esta solução, as equipes de hardware e software estão trabalhando juntas para resolver quaisquer problemas que ocorram.
Embora a DataON continue a oferecer uma ampla variedade de nós para casos de uso do Windows Server, eles identificaram três famílias de configuração principais em seu portfólio de sistemas integrados. O AZS-6112, o AZS-6212 e o AZS-6224 são todos semelhantes porque executam o servidor Intel, a CPU e a pilha de armazenamento. O 6112 é um chassi de baia 1U 12 NVMe menor. O 6224 é um sistema NVMe de 24 baias mais convencional, com mais expansão PCIe do que a oferta menor de 1U. O 6212 é um chassi híbrido com 12 baias de 3.5″ (2x NVMe) para quem precisa de alta capacidade.
Nosso sistema de revisão é o AZS-6224 convencional, com uma configuração básica modesta.
DataON AZS-6224 Configuração
3 x DataON S2D-6224 2U 24x 2.5″ nós de servidor All-NVMe.
Por nó:
- 2x Intel Xeon Scalable Gen3 Gold 6330 2.0 GHz, 28 núcleos, 42 MB de cache
- 32x RDIMM com registro ECC Samsung 64 GB DDR4 3200 MHz
- 2 unidades de inicialização Intel S4520 480 GB SATA M.2
- 1x Placa NVIDIA ConnectX-6 Dx EN de porta dupla QFP56 100GbE RDMA, PCIe 4.0 x16
- 5x SSD Intel DC P5510 NVMe 3.8 TB 2.5″ 144L 3D TLC
Nós conectados via switch NVIDIA SN2010 100 GbE.
DataON AZS-6224 Desempenho
Para medir o desempenho do cluster DataON AZS-6224, provisionamos a VM Fleet distribuída uniformemente no cluster de 3 nós, com um equilíbrio de armazenamento para calcular os recursos. 168 VMs foram implantadas no cluster (uma por núcleo de CPU) com 20 GB de armazenamento por VM em uso. Isso aproveitou 3 TB de armazenamento distribuído uniformemente pelo cluster, com recursos de computação suficientes por trás dele para não ficar preso em alta largura de banda ou testes de E/S.
Aproveitamos as seguintes cargas de trabalho para criar o perfil preciso do cluster DataON AZS-6224:
- Leitura/gravação aleatória de 4K
- Leitura/gravação sequencial de 32K
- Leitura/gravação sequencial de 64K
- 4K aleatório 70% lido, 80% lido e 90% lido
- 8K aleatório 70% lido, 80% lido e 90% lido
- 16K aleatório 70% lido, 80% lido e 90% lido
- VDI: Bootstorm, Login inicial e Login de segunda-feira
Em nosso primeiro teste, analisamos o desempenho aleatório de pequenos blocos com um perfil de leitura e gravação de 4K. O cluster de 3 nós com conectividade de rede de 100 GbE teve um desempenho incrivelmente bom, medindo mais de 4 milhões de IOPS de leitura e 525 mil IOPS de gravação. Na leitura, mediu apenas 0.13ms de latência média, enquanto a latência de gravação chegou a 0.03ms.
Embora o desempenho aleatório seja ótimo, também é importante ver o desempenho de um cluster em relação à largura de banda. Para começar, examinamos um perfil sequencial de 32K. Aqui o DataON AZS-6224 realmente surpreendeu com incríveis 45.6 GB/s em leitura e 14.3 GB/s em gravação.
Mudando para um tamanho de bloco maior de 64 K em uma carga de trabalho sequencial, o AZS-6224 aproveitou a malha de 100 GbE ao limite, gerando 91.5 GB/s de leitura e 13.6 GB/s de gravação. Dizer que ficamos impressionados foi colocar de ânimo leve, foi ótimo ver esse nível de desempenho em um cluster de três nós.
Em seguida, começamos a examinar mais as cargas de trabalho mistas com tráfego aleatório centrado no tamanho do bloco de 4K. Analisamos diferentes porcentagens de leitura, incluindo cargas de trabalho de 70%, 80% e 90%. Aqui, o cluster AZS-6224 mediu 2.8 M IOPS a 90% de leitura, 2.2 M IOPS a 80% de leitura e 1.5 M IOPS a 70% de leitura. A latência média mediu 0.18 ms, 0.70 ms e 1.93 ms, respectivamente.
Em nossa carga de trabalho aleatória de 8K com misturas de leitura de 70%, 80% e 90%, o DataON AZS-6224 continuou a brilhar. Medimos 2.7 milhões de IOPS a 90%, 2.1 milhões de IOPS a 80% e 1.5 milhão de IOPS a 70%, onde o cluster permaneceu aproximadamente na mesma faixa de desempenho de suas cargas de trabalho de 4K, agora apenas aumentando a largura de banda à medida que o tamanho do bloco aumentava. A latência média permaneceu baixa, medindo 0.22ms a 90%, 0.78ms a 80% e 1.90ms a 70% das porcentagens de leitura.
Subindo para 16K de transferências aleatórias, mantivemos as mesmas misturas de leitura de 70%, 80% e 90%. Os níveis de IOPS quase não diminuíram no AZS-6224 dos perfis 4K e 8K. Medimos 2.6 milhões de IOPS a 90%, 2 milhões de IOPS a 80% e 1.5 milhão de IOPS a 70% de leitura, mostrando novamente que o cluster não teve problemas em manter o ritmo conforme os requisitos de largura de banda para tamanhos de bloco maiores aumentaram. A latência média mediu 0.36ms a 70%, 0.87ms a 80% e 1.94ms a 70% de leitura.
Em nossos dois grupos de carga de trabalho mistos finais, avançamos para aproximações sintéticas de cargas de trabalho SQL e VDI. O primeiro sendo o SQL Server em combinações de leitura de 80%, 90% e 97%. Para um cluster de 3 nós com 5 unidades NVMe por nó, o desempenho permaneceu muito forte. Medimos 2.1 milhões de IOPS com 80% de leitura, 2.7 milhões de IOPS com 90% de leitura e 3.4 milhões de IOPS com 97% de leitura. A latência mediu 0.81 ms, 0.24 ms e 0.17 ms, respectivamente, em todo o grupo.
Por fim, passamos para nossas cargas de trabalho de VDI, abrangendo perfis como atividades de Bootstorm, Login inicial e Login de segunda-feira. Nesta área, o DataON AZS-3 de 6224 nós manteve sua tendência de apresentar números impressionantes. Medimos 2.5 milhões de IOPS no perfil Bootstorm, 600 mil IOPS no login inicial e 807 mil IOPS no login de segunda-feira.
Além de testar o Azure Stack HCI, decidimos reprovisionar exatamente o mesmo hardware no VMware vSAN apenas para fins de perspectiva. Azure Stack HCI e vSAN não são exatamente a mesma coisa, o vSAN continua com mais recursos completos e com algumas de suas considerações de design de armazenamento e rede, não está tentando ser o HCI mais rápido disponível.
Dado o diferencial de desempenho, focamos em uma comparação de quatro cantos e uma carga de trabalho mista entre Azure Stack HCI e VMware vSAN. Enquanto o lado do Windows Server permite que você use uma arquitetura flash plana (aproveitando totalmente todas as unidades em cada nó para atividade de leitura e gravação), o layout VMware vSAN precisa de dois SSDs para cache de gravação e três ou mais SSDs para capacidade. Isso coloca o vSAN em uma posição difícil para cargas de trabalho de alto desempenho, o que é piorado com configurações de nós menores.
Na leitura aleatória de 4K usando o banco HCI no VMware, medimos 699K IOPS de leitura e 257K IOPS de gravação do vSAN, com uma latência média de 0.59ms e 1.51ms, respectivamente. Isso torna a configuração do HCI do Azure Stack mais de 5.8 vezes mais rápida na leitura e 2 vezes mais rápida na taxa de transferência de gravação.
Passando para o desempenho sequencial de blocos grandes com uma carga de trabalho de 64 K, medimos 19 GB/s de leitura e 3.2 GB/s de gravação por meio do vSAN com uma latência média de 1.57 ms e 8.09 ms. Nesse caso, o Azure Stack HCI mais do que quadruplicou o desempenho de leitura e ofereceu mais de 4.1x o desempenho de gravação.
Mudando o foco para cargas de trabalho mistas, comparamos as cargas de trabalho de leitura de 80%, 90% e 97% do SQL Server entre as duas configurações. No vSAN, medimos 436 IOPS a 80%, 546 IOPS a 90% e 630 IOPS a 97%. Com cargas de trabalho mistas, o Azure Stack HCI chegou cerca de 4.7 a 5.4 vezes mais rápido. Mais uma vez, os números vSAN por si só ainda são muito fortes, especialmente para um cluster de três nós. Tão forte que, para a maioria dos clientes, ofereceria desempenho superior ao necessário. Esta comparação apenas destaca onde o Azure Stack HCI otimizou em torno de designs flash NVMe para ajudar os clientes que precisam ou exigem desempenho de ponta.
Conclusão
A DataON já oferecia algumas de nossas soluções Azure Stack HCI favoritas. Agora eles atualizaram sua linha com as mais recentes tecnologias Intel, novo software e matriz de suporte aprimorada. Essa combinação, especialmente com o novo aplicativo MUST Pro, coloca-os no mesmo campo de jogo que outros como Lenovo e Dell, que oferecem soluções integradas para Azure Stack HCI. A DataON, no entanto, é mais rápida para adotar e certificar novos equipamentos da Intel e, com base nas citações que a StorageReview viu, eles são muito mais econômicos.
O cluster DataON AZS-4 Azure Stack HCI baseado em Gen6224 NVME realmente o atingiu em todas as áreas em relação ao desempenho. O pico de largura de banda chegou a 91.5 GB/s, que há alguns anos seria inédito em um cluster de desempenho, sem mencionar uma plataforma HCI de 3 nós.
Cargas de trabalho aleatórias e mistas também não foram problema para esta plataforma, com Leitura aleatória de 4K com pico de 4M IOPS e 8K 70/30 superando 1.5M IOPS. A discussão de desempenho nesse tipo de plataforma fica bem interessante, já que o armazenamento está tão longe de ser o gargalo, que você começa a olhar mais para malha de rede ou aplicativos para ajuste. Ou o administrador de TI pode apenas sentar e aproveitar os comentários dos usuários sobre tempos de resposta quase imperceptíveis.
A Microsoft fez recentemente uma mudança fundamental e crítica em sua abordagem de HCI. O Azure Stack HCI não é mais um recurso do Windows Server, é uma entidade distinta. Uma de suas missões é acompanhar o ritmo da nuvem pública do Azure, além de adicionar recursos, como suporte a GPU, onde eles podem estar um pouco atrasados. Esse ritmo de adoção de novos recursos está acelerando rapidamente agora, com um grande lançamento do 2S21 chegando muito em breve.
Com todas as novidades que a DataON já implantou e futuras atualizações da Microsoft chegando, estamos realmente impressionados com o que uma empresa tão pequena (relativamente falando) está alcançando. O DataON AZS-6224 é uma solução HCI incrível, que com apenas 15 SSDs Intel P5510, registrou mais de 4 milhões de IOPS e 91.5 GB/s. Isso é insano.
Envolva-se com a StorageReview
Newsletter | YouTube | LinkedIn | Instagram | Twitter | Facebook | TikTok | RSS feed