Home Empreendimento Revisão do acelerador de aplicativos Fusion-io ioDrive2 Duo SLC (1.2 TB)

Revisão do acelerador de aplicativos Fusion-io ioDrive2 Duo SLC (1.2 TB)

by Kevin O'Brien

O Fusion-io ioDrive2 Duo é um acelerador de aplicativos de altura total e meio comprimento que, quando combinado com SLC NAND, oferece 1.2 TB de armazenamento de baixa latência e alta resistência para os aplicativos mais exigentes da atualidade. Embora marcado como um produto de segunda geração, o nome é um tanto enganoso, pois o Fusion-io é há muito tempo pioneiro na faixa de memória como armazenamento com seus diversos produtos ioMemory. Essa experiência é mostrada não apenas no desenvolvimento de produtos e nos destaques da folha de especificações, mas também em todo o gerenciamento; O Fusion-io possui o pacote de software de gerenciamento de unidade mais robusto do mercado com o ioSphere. Ainda assim, um software bonito e um design de drive comprovado são apenas parte da equação. As empresas implantam esses produtos com um objetivo em mente; reduza os tempos de resposta do aplicativo atacando a latência do sistema de armazenamento. A iteração SLC do ioDrive2 traz foco total para esse problema, oferecendo latência de acesso de leitura de 47µs e latência de acesso de gravação de 15µs. Isso se compara à latência de acesso de leitura de 68 µs no ioDrive2 baseado em MLC (eles têm a mesma latência de gravação) e, embora cerca de 20 µs não pareça muito, pode ser uma eternidade virtual para aplicativos que foram ajustados para uso com armazenamento flash .


O Fusion-io ioDrive2 Duo é um acelerador de aplicativos de altura total e meio comprimento que, quando combinado com SLC NAND, oferece 1.2 TB de armazenamento de baixa latência e alta resistência para os aplicativos mais exigentes da atualidade. Embora marcado como um produto de segunda geração, o nome é um tanto enganoso, pois o Fusion-io é há muito tempo pioneiro na faixa de memória como armazenamento com seus diversos produtos ioMemory. Essa experiência é mostrada não apenas no desenvolvimento de produtos e nos destaques da folha de especificações, mas também em todo o gerenciamento; O Fusion-io possui o pacote de software de gerenciamento de unidade mais robusto do mercado com o ioSphere. Ainda assim, um software bonito e um design de drive comprovado são apenas parte da equação. As empresas implantam esses produtos com um objetivo em mente; reduza os tempos de resposta do aplicativo atacando a latência do sistema de armazenamento. A iteração SLC do ioDrive2 traz foco total para esse problema, oferecendo latência de acesso de leitura de 47µs e latência de acesso de gravação de 15µs. Isso se compara à latência de acesso de leitura de 68 µs no ioDrive2 baseado em MLC (eles têm a mesma latência de gravação) e, embora cerca de 20 µs não pareça muito, pode ser uma eternidade virtual para aplicativos que foram ajustados para uso com armazenamento flash .

Além dos ganhos de folha de especificações em latência e desempenho de taxa de transferência, o Fusion-io tem trabalhado arduamente para fazer várias outras melhorias materiais para a plataforma nesta última geração. Os dispositivos ioDrive da geração anterior tinham um recurso chamado FlashBack, que permitia que a unidade continuasse operando no caso de uma falha NAND, e os aceleradores de aplicativos ioDrive2 construíram esse atributo com a nova versão chamada Adaptive FlashBack. O Adaptive FlashBack aumenta as tolerâncias de falha da matriz NAND, mantendo a unidade on-line e os dados seguros no caso improvável de várias falhas NAND. Nesse caso, o ioDrive2 pode remapear e recuperar sem ficar offline. 

A Fusion-io também lançou um novo controlador NAND e uma compilação de firmware para a família ioDrive2. Os benefícios aqui são amplamente relacionados ao desempenho, melhor taxa de transferência e latência aprimorada, mas também há um benefício de compatibilidade NAND. O Fusion-io também atualizou seu software VSL para 3.2.x que, em combinação com o novo controlador NAND, oferece ao ioDrive2 desempenho aprimorado com tamanhos de bloco menores. Já no assunto NAND, o Fusion-io fez uma alteração na arquitetura de hardware que coloca o NAND em seus próprios módulos, separados do controlador NAND, tornando o design mais simples. O benefício líquido é que o Fusion-io pode suportar mais rapidamente uma nova embalagem NAND ou NAND, aproveitando o mesmo layout de PCB. 

Embora nos aprofundemos na visão geral do hardware na seção de design abaixo, é instrutivo fornecer uma breve visão geral da arquitetura do Fusion-io aqui. Como o Virident FlashMAX II analisamos anteriormente, o design do ioDrive2 aproveita um FPGA que transfere a maior parte das tarefas de gerenciamento NAND para a CPU do host. Enquanto outros designs como Micron's P320h aproveitando um controlador integrado para a maioria dessas tarefas, o Fusion-io prefere aproveitar a CPU poderosa e frequentemente subutilizada no sistema host. Esse design também tende a fornecer um caminho mais direto para o armazenamento, reduzindo a latência do armazenamento. O design do Duo utiliza controladores gêmeos, como o FlashMAX II, mas diverge porque usa seis placas filhas que incluem apenas NAND, em vez de combinar o NAND e os controladores em PCBs individuais. Ao contrário da solução Virident, porém, o Fusion-io com VSL 3.2.2 apresenta quatro unidades de 300 GB para o sistema, em vez de um volume que o Virident apresenta. Os usuários podem optar por endereçar cada volume por conta própria, mas para obter um único volume, eles devem ser colocados no RAID de software. Também é importante notar que os cartões Fusion-io Duo têm meio comprimento de altura total, tornando-os maiores do que os cartões universais de meia altura e meio comprimento oferecidos por Virident, Micron e outros. Dito isso, a maioria dos servidores Tier 1 1U e 2U no mercado hoje acomoda facilmente os cartões FHHL, tornando o formato do cartão relevante apenas em casos marginais. 

O Fusion-io envia o ioDrive2 Duo nas configurações MLC e SLC. O MLC vem com capacidade de 2.4 TB, o SLC 1.2 TB. As unidades têm garantia de cinco anos.

Especificações do Fusion ioDrive2 Duo

  • ioDrive2 Duo Capacidade 1.2 TB SLC
    • Largura de banda de leitura (1 MB) 3.0 GB/s
    • Largura de banda de gravação (1 MB) 2.5 GB/s
    • Corrido. Ler IOPS (512B) 700,000
    • Corrido. IOPS de gravação (512B) 1,100,000
    • Corrido. Ler IOPS (4K) 580,000
    • Corrido. IOPS de gravação (4K) 535,000
    • Latência de acesso de leitura 47µs
    • Latência de acesso de gravação 15µs
  • Célula de nível único (SLC) de memória flash NAND de 2xnm
  • Interface de barramento PCI-Express 2.0 x8 elétrico x8 físico
  • Peso: Menos de 11 onças
  • Fator de forma: altura total, meio comprimento (FHHL)
  • Garantia: 5 anos ou resistência máxima usada
  • Resistência: 190PBW (95PBW por controlador)
  • Sistemas operacionais suportados
    • Microsoft Windows Microsoft Windows: Windows Server 64 de 2012 bits, Windows Server 2008 R2, Windows Server 2008, Windows Server 2003
    • Linux RHEL 5/6; SLES 10/11; OEL 5/6; CentOS 5/6; Debian Squeeze; Fedora 16/17; openSUSE 12; Ubuntu 10/11/12
    • UNIX Solaris 10/11 x64; OpenSolaris 2009.06 x64; OS X 10.6/10.7/10.8
    • Hypervisors VMware ESX 4.0/4.1/ESXi 4.1/5.0/5.1, Windows 2008 R2 com Hyper-V, Hyper-V Server 2008 R2

Design e Construção

O Fusion ioDrive2 Duo 1.2TB SLC é uma placa PCI-Express 8 x2.0 Full-Height Half-Length (FHHL), com dois controladores e um switch PCIe conectado à placa de circuito principal. O NAND é conectado por meio de duas placas filhas, dando ao Fusion uma vantagem de fabricação ao mudar para novas configurações NAND. Em vez de redesenhar o cartão cada vez que uma mudança de litografia rola (NAND morrer encolher), eles podem instalar uma nova placa filha e atualizar o novo firmware no FPGA. Nosso SLC ioDrive2 Duo é formado por dois dispositivos ioMemory de 600GB, cada um usando 4 vias de conexão PCIe. O layout da placa de circuito impresso é muito eficiente, com grandes dissipadores de calor passivos cobrindo os dois controladores no lado direito da placa.

Cada controlador representa um ioDrive2, com seu próprio FPGA Xilinx Virtex-40 de 6 nm e pool de 768 GB de SLC NAND. O ioDrive2 Duo que analisamos usa Micron NAND, mas o Fusion-io é independente do fabricante NAND. O NAND é dividido entre 24 chips de 32 GB por dispositivo, com 600 GB utilizáveis ​​na formatação padrão. Essa proporção coloca os níveis de superprovisionamento de estoque em 22%, quase no mesmo nível da maioria dos dispositivos flash corporativos.

As interfaces Fusion ioMemory com flash NAND como um processador interagiriam com a memória do sistema; ele usa uma combinação do controlador NAND (FPGA) do Fusion-io, que se comunica diretamente pelo PCIe, e o driver do Fusion-io ou o software Virtual Storage Layer (VSL) instalado no sistema host para converter o dispositivo em um dispositivo de bloco tradicional. Por meio do VSL do Fusion-io, o software emula um dispositivo de bloco para compatibilidade, embora o Fusion também ofereça um SDK para permitir que os fornecedores de software se comuniquem nativamente com NAND, ignorando a sobrecarga de emulação. O ioMemory também não é tradicional no sentido de que consome recursos do sistema para que os drivers VSL funcionem, aproveitando a CPU do host e, ao mesmo tempo, criando um espaço na memória do sistema. Em termos de suporte ao produto, como o Fusion-io usa um FPGA como controlador NAND em vez de um ASIC, eles podem implantar atualizações de software de nível muito baixo que podem resolver correções de bugs e aprimoramentos de desempenho. Isso contrasta com os controladores SSD padrão, onde mudanças fundamentais só podem ser feitas por meio da fabricação de um novo controlador – embora ambos os designs permitam um ajuste de nível mais alto por meio de atualizações de firmware. 

Um aprimoramento que veio com o lançamento do VSL 3.2.2 para dispositivos ioDrive2 é um novo recurso de controlador. Anteriormente, cada dispositivo ioMemory aparecia como um único dispositivo no sistema host. Nas versões mais atuais do VSL da Fusion, o controlador é dividido em dois dispositivos e opera no modo "dual-pipe". Portanto, em vez de um LUN para um ioDrive2 e dois LUNs para um ioDrive2 Duo, são dois ou quatro LUNs, respectivamente. Em nossos testes trabalhando com o layout antigo e novo, notamos uma forte melhoria no desempenho de pequenas E/S, embora todos os nossos benchmarks formais tenham ocorrido apenas com o VSL 3.2.2.

A energia é outro tópico que surge com frequência quando os dispositivos Fusion ioMemory são comparados ao cenário PCIe, pois eles se destacam como um dos poucos com conexões de energia externa para determinados aplicativos. Isso se aplica aos produtos da família Duo, que são dois dispositivos ioMemory em uma única placa PCIe. Nesses casos, para operar com potência total, eles consomem mais de 25 watts, que é a classificação mínima de potência x8 PCIe. O Fusion-io tem duas maneiras de atender a esse requisito de energia: cabos de alimentação externos ou substituições de energia que permitem que a placa consuma mais de 25 W por meio de um slot PCIe x8. Em nossa análise que avaliou o ioDrive2 Duo SLC dentro de um Lenovo ThinkServer RD630, realizamos todos os benchmarks com o power-override habilitado, dando-nos desempenho total sem a necessidade de alimentação externa. No guia de instalação de hardware, o Fusion-io afirma que, se o servidor host estiver classificado para um consumo de energia de 55 W, a substituição de software pode ser habilitada com segurança.

Software de Gestão

O Fusion-io definiu continuamente o padrão que outros fabricantes tentam alcançar com seu pacote ioSphere ioMemory Data Center Management. Como vimos trabalhando extensivamente com aceleradores de aplicativos concorrentes, até mesmo uma GUI básica no Windows é difícil de obter, com muitos fabricantes oferecendo suporte CLI limitado. Isso desempenha um papel importante no gerenciamento de longo prazo de um determinado dispositivo flash. já que a garantia e a vida útil esperada voltam ao perfil de uso em um determinado ambiente. 

O ioSphere da Fusion aborda muitas áreas importantes para um administrador de TI por meio de uma interface da Web, incluindo: desempenho histórico e em tempo real, monitoramento de integridade e previsão de garantia. O ioSphere oferece suporte ao monitoramento de dispositivos ioMemory instalados localmente, bem como dispositivos ioMemory instalados em uma grande rede, e também pode ser configurado com acesso remoto para permitir que os administradores monitorem dados fora do datacenter. Este extenso conjunto de recursos é incomparável.

Sem exceção, um dos recursos mais interessantes é o streaming de desempenho em tempo real. O ioSphere permite que os usuários se conectem a um dispositivo ioMemory específico e observem a atividade atingindo o dispositivo conforme ela acontece. Usamos esse recurso extensivamente em testes, conforme mostrado acima no fluxo capturado durante um interno de nosso Benchmark de banco de dados MarkLogic NoSQL. Como o ioSphere está constantemente registrando dados de todos os dispositivos ioMemory conectados, ele também pode criar relatórios mostrando informações de desempenho anteriores para que você possa estimar melhor quanto tempo um determinado dispositivo ioMemory durará em um determinado ambiente de produção.

Para usuários interessados ​​em informações avançadas, o ioSphere também rastreará o uso de energia, a temperatura do cartão, o total de dados lidos e gravados e uma infinidade de outros detalhes úteis durante a depuração. Esses dados podem ser acessados ​​por meio do ioSphere e do Fusion-io CLI instalado por padrão com os drivers de dispositivo. Outra área em que esses recursos avançados entram em ação é o super ou insuficiente provisionamento da unidade, que troca capacidade por desempenho. Em nossa avaliação, testamos o ioDrive2 Duo SLC nos modos padrão e de alto desempenho. O modo de alto desempenho tem 20% de superprovisionamento adicional, embora para usuários avançados o Fusion-io forneça a capacidade de selecionar o nível exato de super ou subprovisionamento. Quando subprovisionado, os usuários podem aumentar a capacidade do ioDrive2 acima da capacidade anunciada (às custas de desempenho e resistência). 

Histórico de testes e comparáveis 

Todos os aceleradores de aplicativos comparados nesta análise são testados em nossa plataforma de teste empresarial de segunda geração, que consiste em um processador baseado em Intel Romley Lenovo ThinkServer RD630. Esta nova plataforma está configurada tanto com Windows Server 2008 R2 SP1 quanto com Linux CentOS 6.3 para nos permitir testar efetivamente o desempenho de diferentes AAs nos vários ambientes que seus drivers suportam. Cada sistema operacional é otimizado para o mais alto desempenho, incluindo ter o perfil de energia do Windows definido como alto desempenho, bem como cpuspeed desabilitado no CentOS 6.3 para travar o processador em sua velocidade de clock mais alta. Para benchmarks sintéticos, utilizamos FIO versão 2.0.10 para Linux e versão 2.0.12.2 para Windows, com os mesmos parâmetros de teste usados ​​em cada SO onde permitido.

ArmazenamentoReveja a configuração do Lenovo ThinkServer RD630:

  • 2 x Intel Xeon E5-2620 (2.0 GHz, 15 MB de cache, 6 núcleos)
  • Chipset Intel C602
  • Memória – 16GB (2 x 8GB) 1333Mhz DDR3 RDIMMs registrados
  • Windows Server 2008 R2 SP1 de 64 bits, Windows Server 2012 Standard, CentOS 6.3 de 64 bits
  • SSD de inicialização RealSSD P100e de 400 GB Micron
  • HBA LSI 9211-4i SAS/SATA 6.0 Gb/s (para SSDs de inicialização)
  • LSI 9207-8i SAS/SATA 6.0Gb/s HBA (para benchmarking de SSDs ou HDDs)

Quando se trata de escolher comparáveis ​​para esta revisão, escolhemos os mais novos SLC e MLC Application Accelerators de alto desempenho. Estes foram escolhidos com base nas características de desempenho de cada produto, bem como na faixa de preço. Incluímos resultados de benchmark de estoque e de alto desempenho para o ioDrive2 Duo SLC e comparamos com o Micron RealSSD P320h, bem como o Virident FlashMAX II superprovisionado no modo de alto desempenho. 

SLC Fusion ioDrive1.2 Duo de 2 TB

  • Lançado: 2S2011
  • Tipo NAND: SLC
  • Controlador: 2 x FPGA com firmware proprietário
  • Visibilidade do dispositivo: 4 dispositivos JBOD
  • Fusion-io VSL Versão do Windows: 3.2.2
  • Fusion-io VSL Linux Versão: 3.2.2
  • Tempo de pré-condicionamento: 12 horas

700GB Micron RealSSD P320h

  • Lançado: 2S2011
  • Tipo NAND: SLC
  • Controlador: 1 x ASIC proprietário
  • Visibilidade do dispositivo: dispositivo único
  • Micron Windows: 8.01.4471.00
  • Micron Linux: 2.4.2-1
  • Tempo de pré-condicionamento: 6 horas

Virident FlashMAX II de 2.2 TB

  • Lançado: 2S2012
  • Tipo NAND: MLC
  • Controlador: 2 x FPGA com firmware proprietário
  • Visibilidade do dispositivo: dispositivo único ou duplo, dependendo da formatação
  • Virident Windows: Versão 3.0
  • Virident Linux: Versão 3.0
  • Tempo de pré-condicionamento: 12 horas

Análise de Carga de Trabalho Sintética Corporativa

A maneira como olhamos para as soluções de armazenamento PCIe é mais profunda do que apenas olhar para o desempenho tradicional de explosão ou estado estável. Ao observar o desempenho médio durante um longo período de tempo, você perde de vista os detalhes por trás do desempenho do dispositivo durante todo esse período. Como o desempenho do flash varia muito com o passar do tempo, nosso processo de benchmarking analisa o desempenho em áreas como taxa de transferência total, latência média, latência de pico e desvio padrão durante toda a fase de pré-condicionamento de cada dispositivo. Com produtos corporativos de ponta, a latência geralmente é mais importante do que a taxa de transferência. Por esse motivo, nos esforçamos ao máximo para mostrar todas as características de desempenho de cada dispositivo que colocamos em nosso Enterprise Test Lab.

Também incluímos comparações de desempenho para mostrar como cada dispositivo funciona com um driver diferente definido nos sistemas operacionais Windows e Linux. Para Windows, usamos os drivers mais recentes no momento da revisão original, em que cada dispositivo é testado em um ambiente Windows Server 64 R2008 de 2 bits. Para Linux, usamos o ambiente CentOS 64 de 6.3 bits, compatível com cada Enterprise PCIe Application Accelerator. Nosso principal objetivo com este teste é mostrar como o desempenho do sistema operacional difere, já que ter um sistema operacional listado como compatível em uma folha de produto nem sempre significa que o desempenho entre eles é igual.

O desempenho do flash varia durante a fase de pré-condicionamento de cada dispositivo de armazenamento. Com designs diferentes e capacidades variadas, nosso processo de pré-condicionamento dura 6 horas ou 12 horas, dependendo do tempo necessário para atingir o comportamento de estado estacionário. Nosso principal objetivo é garantir que cada unidade esteja totalmente no modo de estado estacionário no momento em que iniciamos nossos testes primários. No total, cada um dos dispositivos comparáveis ​​é apagado com segurança usando as ferramentas do fornecedor, pré-condicionado em estado estacionário com a mesma carga de trabalho com a qual o dispositivo será testado sob uma carga pesada de 16 threads com uma fila pendente de 16 por thread e, em seguida, testado em intervalos definidos em vários perfis de profundidade de encadeamento/fila para mostrar o desempenho em uso leve e pesado.

Atributos monitorados em testes de pré-condicionamento e estado estacionário primário:

  • Rendimento (Agregado de IOPS de Leitura+Gravação)
  • Latência média (latência de leitura+gravação calculada em conjunto)
  • Latência máxima (latência máxima de leitura ou gravação)
  • Desvio padrão de latência (desvio padrão de leitura + gravação calculado em conjunto)

Nossa Enterprise Synthetic Workload Analysis inclui quatro perfis baseados em tarefas do mundo real. Esses perfis foram desenvolvidos para facilitar a comparação com nossos benchmarks anteriores, bem como valores amplamente publicados, como velocidade máxima de leitura e gravação de 4K e 8K 70/30, que é comumente usado para unidades corporativas. Também incluímos duas cargas de trabalho mistas herdadas, o servidor de arquivos tradicional e o servidor da Web, cada um oferecendo uma ampla combinação de tamanhos de transferência.

  • 4K
    • 100% de leitura ou 100% de gravação
    • 100% 4K
  • 8K 70/30
    • 70% de leitura, 30% de gravação
    • 100% 8K
  • Servidor de arquivos
    • 80% de leitura, 20% de gravação
    • 10% 512b, 5% 1k, 5% 2k, 60% 4k, 2% 8k, 4% 16k, 4% 32k, 10% 64k
  • webserver
    • 100% lido
    • 22% 512b, 15% 1k, 8% 2k, 23% 4k, 15% 8k, 2% 16k, 6% 32k, 7% 64k, 1% 128k, 1% 512k

Em nossa primeira carga de trabalho, examinamos um perfil de pré-condicionamento de gravação 4K totalmente aleatório com uma carga de trabalho excelente de 16T/16Q. Neste teste, o Fusion ioDrive2 Duo SLC oferece o maior desempenho de rajada no grupo, medindo quase 550,000 IOPS de rajada com seu driver Linux. No Windows, as velocidades de pico ficaram mais baixas em 'apenas' 360-420,000 IOPS. Observando seu desempenho ao se aproximar do estado estacionário, o ioDrive2 Duo no modo HP estabilizou em cerca de 230,000 IOPS no Linux e 200,000 IOPS no Windows. No modo de capacidade de estoque, o desempenho mediu cerca de 140,000 IOPS no Linux e 115,000 IOPS no Windows.

Com uma carga pesada de 16T/16Q, a latência média no Fusion ioDrive2 Duo mediu entre 1.85ms e 2.20ms no modo de capacidade de estoque para Linux e Windows, respectivamente. Em configurações de alto desempenho, a latência caiu para cerca de 1.10ms e 1.25ms.

Comparando a latência máxima no ioDrive2 Duo no Windows e Linux com nosso perfil de gravação aleatória de 4k, foi fácil perceber que ele favoreceu um ambiente Linux quando se trata de tempos de resposta de pico. Ao longo do período de pré-condicionamento, a latência máxima do Windows variou entre 40-360ms na capacidade de estoque e 100-250ms no modo de alto desempenho. Isso contrasta com seu desempenho no Linux, que manteve tempos de resposta de pico entre 20-50 ms para configurações padrão e de alto desempenho.

Analisando o desvio padrão de latência, o Fusion ioDrive2 Duo SLC teve menos consistência de latência no Windows nos modos padrão e de alto desempenho do que no Linux. Comparando-o com o Micron P320h e o Virident FlashMAX II no modo HP, ambos os modelos mantiveram aproximadamente a mesma consistência em ambos os sistemas operacionais.

Depois que nosso período de pré-condicionamento de 12 horas terminou no ioDrive2 Duo SLC, ele apresentou desempenho 4k aleatório em estado estacionário, medindo um pico de 231,456 IOPS no Linux quando provisionado no modo de alto desempenho. Isso deu a ele o maior desempenho aleatório de gravação em 4K do grupo, embora seu desempenho no Windows estivesse praticamente alinhado com a velocidade de gravação do Micron P320h. No modo de desempenho de estoque, as velocidades de gravação aleatória de 4K caíram para 114,917 IOPS no Windows e 139,421 IOPS no Linux. Isso estava praticamente no mesmo nível do FlashMAX II com ele configurado em seu modo de alto desempenho. Olhando para a velocidade de leitura aleatória de 4K do grupo, o Micron P320h liderou o pacote com 637k IOPS no Linux, com o ioDrive2 Duo SLC medindo 460-463k IOPS no Linux e 384-392k IOPS no Windows.

Comparando a latência média com uma carga de trabalho pesada de 16T/16Q com 100% de atividade de leitura aleatória de 4K, o ioDrive2 Duo SLC mediu entre 0.550-0.552ms no Windows e 0.649-0.663ms no Linux. Mudando para o desempenho de gravação, mediu 1.102-1.255ms no modo de alto desempenho e 1.832-2.223ms em capacidade de estoque, com sua força de gravação no lado do Linux.

Ao comparar a latência máxima, o Fusion ioDrive2 Duo se destacou no Windows com os tempos de resposta de pico mais altos do grupo, medindo 373-1018ms com atividade de gravação aleatória de 4k. Seu desempenho no Linux foi muito melhor, medindo 43-51ms no máximo. Quando se trata de latência máxima de leitura, o ioDrive2 Duo no Windows lidera o pacote com latência máxima medindo 3.32-3.76 ms.

Comparando o desvio padrão de latência entre cada PCIe AA em nosso perfil aleatório de 4K, o ioDrive2 Duo SLC ofereceu excelente consistência de latência de leitura no Windows, mas com a atividade de gravação apresentou uma das latências menos consistentes do grupo. Isso foi aprimorado em um ambiente Linux, embora aqueles também tenham avançado mais do que outros no grupo. No topo do grupo está o Micron RealSSD P320h, oferecendo desvio padrão de latência balanceado com atividade de leitura e gravação.

Nosso próximo teste muda para uma carga de trabalho mista de 8K 70/30, onde o ioDrive2 Duo SLC liderou o pacote com as maiores velocidades de pico, medindo entre 424-443,000 IOPS, com maior taxa de transferência no Windows. À medida que o desempenho se aproximava do estado estável, o ioDrive2 Duo SLC em capacidade de estoque mediu entre 140-148k IOPS, que aumentou para 195-200k IOPS no modo de alto desempenho.

Comparando a latência média em nossa carga de trabalho de 8k 70/30, o Fusion ioDrive2 Duo SLC mediu 0.57-0.59ms em rajada (pequena vantagem no Windows) e aumentou para cerca de 1.70-1.80ms em capacidade de estoque e 1.28-1.33ms em modo de alto desempenho .

À medida que o ioDrive2 Duo SLC transitava de rajada para estado sustentado ou estacionário, a latência de pico no Windows e no Linux, bem como os modos de estoque e de alto desempenho flutuavam entre 50-250ms. Isso em comparação com o Micron P320h que media 10-30ms ou o Virident FlashMAX II que media entre 30-50ms.

Enquanto a latência máxima do ioDrive2 Duo foi alta em nosso teste de pré-condicionamento de 8k 70/30, notamos sua consistência de latência no modo de alto desempenho encaixado logo atrás do Micron P320h. Na configuração de capacidade de estoque, ele escalou um pouco mais alto do que o Virident FlashMAX II.

Em comparação com a carga de trabalho fixa de 16 encadeamentos e 16 filas que executamos no teste de gravação 100% 4K, nossos perfis de carga de trabalho mistos dimensionam o desempenho em uma ampla variedade de combinações de encadeamento/fila. Nesses testes, expandimos nossa intensidade de carga de trabalho de 2 threads e 2 filas até 16 threads e 16 filas. Em nosso teste 8K 70/30 expandido, o Fusion ioDrive2 Duo SLC teve o desempenho de pico mais alto do grupo na configuração de alto desempenho. Comparando-o diretamente com o Micron P320h, ele foi capaz de oferecer um desempenho de profundidade de fila baixa muito maior em 2, 4, 8 e 16 threads, mas depois ficou para trás conforme a profundidade da fila aumentou. No provisionamento de estoque, ele ofereceu desempenho notavelmente próximo ao Virident FlashMAX II com ele configurado no modo de alto desempenho.

No segmento de latência média escalada de nosso teste 8k 70/30, descobrimos que o Fusion ioDrive2 Duo SLC oferecia a menor latência média do grupo, graças em parte ao seu forte desempenho em baixas profundidades de fila. Com o aumento da profundidade da fila, o Micron P320h assumiu a liderança, até 16T/16Q onde o ioDrive2 Duo SLC saiu na frente novamente.

Ao compararmos a latência máxima em nosso teste escalado de 8k 70/30, registramos alguns picos maiores do ioDrive2 Duo SLC, que parecia aumentar à medida que a profundidade efetiva da fila aumentava. Isso foi mais notável com o ioDrive2 de capacidade de estoque no Windows. Seu desempenho no Linux, assim como no Windows no modo de alto desempenho, manteve a latência de pico abaixo de 70ms em cargas efetivas menores ou iguais a QD64, enquanto a latência em QD128 e QD256 aumentou para 160ms e 220ms, respectivamente.

Em nosso teste escalado de 8k 70/30, o Micron P320h liderou o pacote com a latência mais consistente em todas as cargas de trabalho, com o Virident FlashMAX II em segundo lugar e o ioDrive2 Duo SLC em alto desempenho logo atrás. 

A carga de trabalho do servidor de arquivos representa um espectro de tamanho de transferência maior atingindo cada dispositivo específico, portanto, em vez de se acomodar a uma carga de trabalho estática de 4K ou 8K, a unidade deve lidar com solicitações que variam de 512b a 64K. Nesta carga de trabalho, como o Fusion ioDrive2 Duo SLC teve que começar a lidar com uma distribuição de transferência maior, ele foi capaz de flexionar alguns músculos e liderar o grupo no modo de alto desempenho. Em rajada, o ioDrive2 Duo SLC teve uma taxa de transferência quase o dobro do Micron P320h e do Virident FlashMAX II, medindo cerca de 305,000 IOPS. Ao se aproximar do estado estacionário no modo de alto desempenho, ele estabilizou em torno de 136,000 IOPS para Windows e Linux, em comparação com os 320 IOPS do P125,000h. Na formatação de capacidade de estoque, a taxa de transferência diminuiu para cerca de 110,000 IOPS, em comparação com o Virident FlashMAX II no modo de alto desempenho que chegou a quase 70,000 IOPS.

Com seu forte desempenho de rajada, a latência média no início de nossa curva de pré-condicionamento mediu cerca de 0.83ms do ioDrive2 Duo SLC, antes de nivelar para 1.87ms no modo de alto desempenho ou cerca de 2.25ms na capacidade de estoque.

À medida que o ioDrive2 Duo SLC passou de burst para sustentado e estado estacionário, a latência de pico começou a aumentar como em nosso teste 8k 70/30, embora não tão alta. Em geral, medimos a latência máxima variando entre 20ms e 200ms do ioDrive2 Duo em todos os modos, sendo o melhor o modo Linux HP. Notamos um pico ligeiramente superior a 1,000ms do ioDrive2 Duo no Windows no modo de alto desempenho também. Em contraste, o Micron P320h manteve a latência de pico abaixo de 20 ms para Windows e Linux.

Embora tenha notado mais oscilação de latência de pico do ioDrive2 Duo em nosso teste anterior, observando seu desvio padrão de latência, ele funcionou no meio do pacote entre o Micron P320h e o Virident FlashMAX II. No geral, o Linux ofereceu melhor consistência nas configurações de estoque e de alto desempenho, com o último tendo mais estabilidade.

Depois que o processo de pré-condicionamento do servidor de arquivos foi concluído com uma carga constante de 16T/16Q, passamos aos nossos testes principais, que medem o desempenho em níveis definidos entre 2T/2T e 16T/16Q. Em nossa principal carga de trabalho do servidor de arquivos, o ioDrive2 Duo SLC ofereceu o desempenho máximo mais alto, medindo 132-135,000 IOPS em 16T/16Q para o P320h, que mediu 125,500 IOPS. O ioDrive2 Duo também mostrou sua baixa força de profundidade de fila sobre o Micron P320h em cargas de trabalho de 2, 4 e 8 threads, tendo uma ligeira vantagem no modo de alto desempenho. À medida que as profundidades das filas aumentavam, o Micron P320h oferecia o melhor desempenho em cada estágio, chegando a um nível muito superior.

Comparando a latência média entre cada acelerador de aplicativo PCIe de primeira classe em nossa carga de trabalho do servidor de arquivos, o ioDrive2 Duo SLC teve a menor latência do grupo, medindo 0.14ms para Linux e Windows em 2T/2Q no modo de alto desempenho. À medida que a carga de trabalho aumentou, o Micron P320h manteve uma forte liderança, até 16T/16Q, onde o ioDrive2 Duo SLC teve a menor latência média na carga de pico.

Observando os tempos de resposta de pico em nosso teste principal do servidor de arquivos, o Fusion ioDrive2 Duo SLC apresentou latência máxima mais alta, que começou a aumentar em cargas de trabalho iguais ou superiores a uma profundidade de fila efetiva de 128. Abaixo de QD128, o ioDrive2 Duo apresentou latência máxima medindo 11 -100ms, com seu melhor desempenho no modo de alto desempenho. 

Mudando nossa visão de tempos de resposta de pico para consistência de latência em nosso teste de servidor de arquivos, o ioDrive2 Duo SLC ficou atrás do Micron P320h no modo de alto desempenho e ofereceu uma ligeira vantagem no desvio padrão de latência em relação ao Virident FlashMAX II na configuração padrão.

Em nossa última carga de trabalho sintética cobrindo um perfil de servidor Web, que é tradicionalmente um teste de leitura 100%, aplicamos atividade de gravação 100% para pré-condicionar totalmente cada unidade antes de nossos testes principais. Sob este teste de pré-condicionamento estressante, o ioDrive2 Duo SLC comandou uma liderança impressionante sobre o Micron P320h e o Virident FlashMAX II nas configurações de estoque e de alto desempenho. Neste teste, as velocidades de pico atingiram 145,000 IOPS, enquanto o Micron P320h atingiu o pico de 67,000 IOPS e o Virident FlashMAX II começou com 32,000 IOPS no modo de alto desempenho.

Com uma pesada carga de trabalho de gravação de 100% de 16T/16Q em nosso teste de pré-condicionamento do servidor Web, o ioDrive2 manteve um tempo de resposta médio de cerca de 3.5-3.8ms na configuração de alto desempenho e 6.4-7.2ms na configuração padrão.

Comparando a latência máxima em nosso teste de pré-condicionamento do servidor Web, o ioDrive2 Duo SLC mediu entre 25-70ms no Linux em modo padrão e de alto desempenho, com a latência de pico do Windows subindo de 25-380ms com alguns picos acima de 1,000ms. 

Comparando a consistência de latência em nossa estressante execução de pré-condicionamento do servidor da Web, o Micron P320h ficou no topo do pacote, com o ioDrive2 Duo SLC chegando no meio. Quando configurado no modo de alto desempenho, ele teve um desempenho mais forte no Windows e no Linux do que na configuração padrão.

Mudando para o segmento principal de nosso teste de servidor Web com um perfil de leitura de 100%, o ioDrive2 Duo SLC teve escala de desempenho de 23.9-25.5k IOPS em 2T/2T, que aumentou para um pico de 141-147k IOPS em 16T/16T. Comparado ao Micron P320h, o ioDrive2 Duo não conseguiu igualar seu desempenho em profundidades de fila baixas ou altas e ficou atrás do Virident FlashMAX II em profundidades de fila efetivas abaixo de QD32, embora acima desse nível ele o tenha superado rapidamente.

A latência média do Fusion ioDrive2 Duo SLC variou de 0.153-0.163ms em 2T/2T e aumentou para um pico de 1.737-1.803ms em 16T/16T. Em geral, o Micron P320h teve a latência mais baixa, enquanto o Virident FlashMAX II teve a vantagem em QD32 e abaixo, que o ioDrive2 Duo SLC foi capaz de superar em profundidades de fila efetivas mais altas.

Em nosso perfil de servidor da Web 100% lido, observamos picos de latência do ioDrive2 Duo SLC de até 130 ms, embora a maioria tenha chegado abaixo de 20 ms de profundidades de fila efetivas abaixo de 256. Sob nossa carga mais alta de 16T/16Q, o ioDrive2 Duo SLC aumentou para 164-320ms, sendo o mais alto medido no Windows na configuração padrão.

Comparando o desvio padrão de latência em nosso teste de servidor da Web com 100% de leitura, o Micron P320h teve uma forte liderança no grupo, com o ioDrive2 Duo SLC atrás ou no mesmo nível do Virident FlashMAX II em profundidades de fila efetivas baixas a altas.

Conclusão

O Fusion-io demonstrou grande capacidade de desenvolver mais do que apenas mudanças incrementais com o acelerador de aplicativos ioDrive2 Duo SLC. Desde o funcionamento interno, como a proteção contra falhas Adaptive FlashBack NAND, até o design aprimorado da placa que move o NAND para suas próprias placas filhas, o Fusion-io fez várias alterações de hardware que tornam o ioDrive2 melhor que o predecessor. A equipe de desenvolvimento trabalhou agressivamente para reduzir a latência na unidade; vimos esses benefícios nos testes 4K 100% e 8K 70/30, onde o ioDrive2 SLC apresentou as melhores pontuações de latência e taxa de transferência sob carga de pico. Ele também teve o desempenho mais forte em profundidades de fila baixas, com uma vantagem significativa sobre o Micron P320h e o FlashMAX II em nosso teste 8k 70/30 em QD2 para cargas de trabalho de 2, 4 e 8 threads. Isso forneceu outro benefício de gerar a latência média mais baixa, pois não precisava ter tantas E/Ss pendentes para gerar um desempenho significativamente maior. Do lado do gerenciamento, o ioDrive2 vem com o ioSphere, o software de gerenciamento de unidade mais abrangente disponível. Compare-o com qualquer pacote de software emparelhado com Application Accelerators atualmente no mercado e ele os supera em termos de recursos e design de interface.

Vimos com a maioria dos outros aceleradores de aplicativos que eles geralmente funcionam melhor em um sistema operacional do que em outro. Claro que é por isso que testamos as unidades no Windows e no Linux, para que possamos descobrir os pontos fortes e fracos de uma unidade. Como vimos com as unidades Fusion-io anteriores, o ioDrive2 Duo se sai muito bem em ambientes Linux, embora fique um pouco mais errático no Windows. Embora mais evidente quando visto em nossos gráficos, o desempenho geral do Windows não sofre muito, mas certamente há espaço para melhorias. Sob cargas de pico de 16T/16Q, notamos blips de latência de pico do ioDrive2 Duo. Embora, ao comparar sua consistência de latência, como um todo não tenha impactado muito esses números. Embora alguns dos números de latência não estejam onde o Fusion-io gostaria, seu design permite atualizações de nível muito baixo que devem ser capazes de suavizar alguns desses problemas de latência ao longo do tempo. Também vale a pena notar no tópico de compatibilidade que o Fusion-io oferece suporte a uma das listas mais robustas de sistemas operacionais, tornando a unidade fácil de implantar em um grande número de casos de uso. 

O design da placa Fusion-io geralmente é criticado pela concorrência porque usa a CPU e a RAM do host para fazer a maior parte do trabalho de gerenciamento NAND. Como vimos, porém, esse é um design eficiente, também empregado pela Virident, que fornece desempenho e latência impressionantes ao alavancar CPUs cada vez mais poderosas. O P320h da Micron é um exemplo brilhante da abordagem alternativa, aproveitando um controlador on-board muito bom, mas sua placa chega a 700 GB de armazenamento SLC, ilustrando os compromissos que devem ser feitos pelos fornecedores de armazenamento. Um novo ataque da indústria contra o Fusion-io é um tanto interessante, este em torno do fator de forma. O ioDrive2 Duo usa um design FHHL, onde a maioria dos outros usa HHHL, que do ponto de vista do ajuste do servidor é um design mais universal. Todos os servidores em nosso laboratório da HP, Dell, Lenovo e SuperMicro oferecem suporte aos formatos FHHL e HHHL, mas vale a pena observar que o design do Fusion-io é um pouco diferente nesse aspecto. Do ponto de vista do design, parece aceitável usar mais espaço para permitir segmentos NAND modulares. Isso limita os custos de projeto durante a longa vida útil da linha de produtos à medida que a NAND muda, mas a concorrência é rápida em notar suas limitações em casos de uso especiais.

Vantagens

  • Oferece o mais alto desempenho máximo em nossas cargas de trabalho 100% 4K, 8k 70/30 e servidor de arquivos
  • O pacote de gerenciamento ioSphere oferece o melhor conjunto de recursos da categoria
  • Taxa de transferência mais alta e latência mais baixa em 8k 70/30 e cargas de trabalho do servidor de arquivos em profundidades de fila baixas
  • Arquitetura comprovada com recursos como Adaptive Flashback para aumentar a confiabilidade

Desvantagens

  • Problemas com latência máxima no Windows e no Linux
  • Perde terreno para o Micron P320h entre as profundidades de fila efetivas mais baixas e mais altas

ponto de partida

O acelerador de aplicativos Fusion-io ioDrive2 Duo SLC fornece 1.2 TB do armazenamento mais rápido disponível em várias cargas de trabalho, oferecendo muitas atualizações de design e recursos em relação ao produto da geração anterior. Uma dessas atualizações é o Adaptive FlashBack, que preserva os dados e mantém a unidade operacional mesmo após várias falhas de matriz NAND. Combinando o melhor software de gerenciamento do setor e a capacidade de melhorar continuamente a unidade sem precisar de um novo controlador, o ioDrive2 Duo SLC certamente encontrará serviço de longo prazo atendendo aos aplicativos mais críticos que podem aproveitar o excelente desempenho de armazenamento. 

Página do produto ioDrive2

Discutir esta revisão