Home Empreendimento O gerenciamento do ciclo de vida da DPU requer soluções criativas de servidor

O gerenciamento do ciclo de vida da DPU requer soluções criativas de servidor

by Haroldo Fritts

Numa era dominada por aplicações orientadas por dados, o cenário computacional tradicional, há muito ditado por CPUs e GPUs, está a passar por uma mudança de paradigma. À medida que as empresas e as instituições migram para ambientes de computação mais complexos, especialmente com os campos emergentes da Inteligência Artificial (IA), da análise de big data e das aplicações nativas da nuvem, as exigências sobre as capacidades de processamento transformaram-se. A Unidade de Processamento de Dados (DPU) traz outro elemento, mas o gerenciamento do ciclo de vida da DPU na empresa é um pouco mais complicado do que parece.

Numa era dominada por aplicações orientadas por dados, o cenário computacional tradicional, há muito ditado por CPUs e GPUs, está a passar por uma mudança de paradigma. À medida que as empresas e as instituições migram para ambientes de computação mais complexos, especialmente com os campos emergentes da Inteligência Artificial (IA), da análise de big data e das aplicações nativas da nuvem, as exigências sobre as capacidades de processamento transformaram-se. A Unidade de Processamento de Dados (DPU) traz outro elemento, mas o gerenciamento do ciclo de vida da DPU na empresa é um pouco mais complicado do que parece.

Gerenciamento do ciclo de vida da DPU DPU NVIDIA BlueField

DPU NVIDIA BlueField

As DPUs, muitas vezes chamadas de SmartNICs ou unidades de processamento de infraestrutura (IPUs), desempenham um papel fundamental ao se tornarem o nexo entre computação (CPUs), gráficos (GPUs) e infraestrutura de rede de armazenamento. Implantadas em nuvem pública e data centers de hiperescala há anos, as DPUs isolam as cargas de trabalho residentes das operações de rede, segurança, armazenamento e outras operações de infraestrutura normalmente associadas às funções do data center. Esse recurso aprimorado libera CPUs e GPUs dessas tarefas, permitindo que se concentrem em sua função principal de computação e renderização.

A introdução de DPUs traz consigo um novo conjunto de desafios: como gerenciar, otimizar e garantir a operação contínua dessas unidades em conjunto com a infraestrutura existente. O gerenciamento de DPU torna-se crucial porque introduz uma nova camada de complexidade. O gerenciamento adequado garante que as DPUs sejam utilizadas em todo o seu potencial, oferecendo benefícios como latência reduzida, maior rendimento e melhor eficiência geral do sistema.

Integrar DPUs no ecossistema computacional mais amplo e garantir o gerenciamento eficaz de DPUs, negócios e instituições pode desbloquear novas áreas de desempenho, agilidade e escalabilidade. À medida que o mundo continua a sua marcha incansável em direção a operações mais centradas em dados, adotar e gerir DPUs será fundamental para manter uma vantagem competitiva no cenário digital.

VMware, a força motriz por trás do interesse na tecnologia DPU

As DPUs emergiram como uma tecnologia transformadora no cenário da computação, atraindo atenção e tração significativas no mercado atualmente. À medida que as organizações enfrentam o crescimento explosivo dos dados, a crescente complexidade das cargas de trabalho e a procura por maior desempenho e eficiência, as DPUs surgiram como uma solução poderosa.

A VMware tem trabalhado para trazer sua pilha de software para DPUs. No entanto, o software proprietário específico do fornecedor associado ao hardware DPU tornou a tarefa de integração ainda mais desafiadora. As portas foram abertas quando a VMware estendeu suporte para vSphere para a DPU, permitindo que os clientes obtenham eficiências normalmente associadas à nuvem em seus data centers usando sua pilha de virtualização preferida. As DPUs também são uma parte fundamental do vSAN 8, aliviando a carga de tarefas de segurança e rede.

Gerenciamento do ciclo de vida de DPU DPU NVIDIA BlueField em Riser 1

DPU NVIDIA BlueField em Riser 1

A VMware pretende claramente continuar a aproveitar ainda mais as DPUs ao longo do tempo; não é totalmente impossível considerar que certos nós do vSphere no futuro serão totalmente alimentados por DPU, sem nenhum x86. Porém, a VMware já está promovendo melhorias de desempenho graças às DPUs.

VMware, executando um armazenamento de chave-valor REDIS no vSphere 8, descobriram que um host habilitado para DPU alcançou desempenho semelhante a um host não habilitado para DPU, com 20% menos núcleos de CPU. Em outro teste, o host habilitado para DPU obteve um rendimento 36% melhor e uma redução de 27% na latência das transações.

Com o aumento do interesse em DPU graças à VMware, fornecedores como a Dell tiveram que encontrar maneiras de incluir a DPU nos projetos, sem esquecer o gerenciamento do ciclo de vida da DPU. O fato é que as DPUs são essencialmente seus próprios computadores, com gerenciamento projetado para ser feito localmente pela Ethernet ou outra porta de administração. Mas isso não é consistente com a forma como as empresas desejam gerenciar o ciclo de vida do hardware, por isso, quando a Dell adotou DPUs, eles tiveram que ser um pouco criativos.

Dell PowerEdge, DPU e iDRAC

Quando você olha para o lado da porta de uma DPU NVIDIA BlueField, ela se parece com uma NIC NVIDIA ConnectX padrão, com uma porta Ethernet extra para gerenciamento. Conforme observado, porém, as empresas desejam poder gerenciar todos os componentes do servidor por meio de um console comum de gerenciamento do ciclo de vida. No caso da Dell, isso significa iDRAC. Portanto, a Dell teve que ser um pouco criativa para conseguir fazer as conexões de hardware necessárias para que o iDRAC reconhecesse a DPU.

Gerenciamento do ciclo de vida de DPU Portas NVIDIA BlueField DPU

Portas NVIDIA BlueField DPU

A própria DPU simplesmente se encaixa nos risers (Riser 1A Slot 2, para ser mais específico), como qualquer placa PCIe faria. Isso fornece energia à DPU e a coloca no BUS do sistema. Mas o gerenciamento da placa não pode ser feito por PCIe, como uma GPU, pelo menos não no momento. O que é necessário é um elemento de hardware adicional para conectar esses pontos. Na foto abaixo de uma placa-mãe R750, o astuto notará uma placa diferente no slot onde normalmente vai o LOM (NIC).

Placa-mãe Dell PowerEdge com placa de interface de gerenciamento (MIC)

Placa-mãe Dell PowerEdge com placa de interface de gerenciamento (MIC)

Ao olharmos mais de perto a Placa de Interface de Gerenciamento (MIC), podemos vê-la no espaço onde normalmente fica o LOM integrado. O MIC habilita uma interface de banda lateral do controlador de rede (NC-SI) entre a DPU e o servidor BMC.

Placa de interface de gerenciamento (MIC) Dell PowerEdge

Placa de interface de gerenciamento (MIC) Dell PowerEdge

Gerenciamento do ciclo de vida de DPU com iDRAC

Existem algumas ferramentas para ajudar a aproveitar ao máximo a tecnologia DPU. O Dell Remote Access Controller (iDRAC) integrado da Dell é uma ferramenta de gerenciamento abrangente projetada para servidores Dell PowerEdge. Ele oferece recursos avançados para monitoramento, administração e controle remoto de servidores.

O iDRAC fornece monitoramento em tempo real dos parâmetros de integridade do servidor, permitindo que os administradores monitorem componentes críticos como CPU, memória, armazenamento, energia e temperatura. O iDRAC simplifica a atualização de firmware, incluindo BIOS, controladores RAID e adaptadores de rede. Essa interface centralizada permite que os administradores gerenciem e implantem atualizações de firmware em vários servidores, garantindo consistência e reduzindo o esforço manual.

Devido ao LOM para troca de MIC e à rigidez extra do cabeamento, a Dell pode gerenciar a DPU por meio do iDRAC, alinhando o gerenciamento do ciclo de vida da DPU com todos os outros componentes principais do servidor PowerEdge. Embora isso pareça bastante simples para o administrador do iDRAC, o trabalho nos bastidores para permitir essa facilidade de gerenciamento para a DPU é impressionante.

Gerenciamento do ciclo de vida de DPU com iDRAC

Gerenciamento do ciclo de vida de DPU com iDRAC

Considerações Finais

É um pouco prematuro dizer que cada nó VMware vSphere ou vSAN deve ser configurado com DPUs para aproveitar as vantagens do vSphere Distributed Services Engine, mas é difícil ignorar os benefícios. Com o crescente volume e complexidade das cargas de trabalho modernas e a demanda por novos serviços definidos por software, as CPUs dos servidores estão sendo sobrecarregadas, deixando menos ciclos de computação para processamento de cargas de trabalho. As DPUs já estão amplamente implantadas em hiperescaladores para lidar com mais funções de infraestrutura e liberar ciclos de CPU para cargas de trabalho geradoras de receita.

Conector MIC de gerenciamento do ciclo de vida DPU

Porta de gerenciamento de DPU NVIDIA BlueField cabeada

Embora os benefícios das DPUs para o vSphere sejam óbvios, a introdução de novos aceleradores nos servidores introduz novos desafios que devem ser resolvidos; neste caso, é o gerenciamento do ciclo de vida do DPU. Graças a alguma engenharia criativa da Dell, as DPUs podem ser conectadas ao BMC nativo e gerenciadas por meio de ferramentas de ciclo de vida tradicionais, como o iDRAC. Isto faz uma grande diferença na adoção de novas tecnologias no data center e deve facilitar a adoção de DPU pelos clientes da Dell.

Visão geral dos novos recursos do vSphere 8

Envolva-se com a StorageReview

Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS feed