ArmazenamentoReview.com

Podcast #143: Os SSDs KIOXIA de 245 TB chegaram!

Empreendimento  ◇  SSD

Maulik Sompura, da KIOXIA, junta-se a Brian para uma discussão aprofundada e informativa sobre tudo relacionado a flash e outros eventos do setor. O tema é oportuno e relevante, dada a expansão massiva da IA ​​e das cargas de trabalho modernas.

Maulik Sompura é Diretor Sênior de Planejamento e Gestão de Produtos na KIOXIA, com mais de 13 anos de experiência em NAND, memória e SSDs, incluindo os últimos seis anos na KIOXIA. Além disso, sua carreira inclui passagens pela Intel e Toshiba.

Família KIOXIA LC9

A conversa vai além do armazenamento e da memória, abordando temas como refrigeração líquida, hiperescaladores e formatos de computadores. Eles também discutem software de código aberto, novas fábricas de semicondutores, preocupações com a escalabilidade e o receio de outro evento de "auge e colapso" como o da Covid.

É uma conversa informativa que o levará a refletir sobre algo a longo prazo. Dividimos o podcast em segmentos de cinco minutos para que você possa acessar a seção mais relevante para você e seu contexto. No entanto, vale a pena assistir ao podcast completo.

Brian e Maulik iniciam a discussão abordando a evolução radical dos SSDs e do armazenamento flash, especialmente sob a pressão da IA ​​e dos data centers de hiperescala.

0:00–5:00: Os hiperescaladores comandam o espetáculo discretamente

  • Os portfólios de SSDs explodiram em complexidade: muitos formatos, níveis de resistência e categorias de desempenho.
  • O boom da IA ​​fez com que o armazenamento se tornasse a segunda prioridade mais importante, logo atrás das GPUs/HBM.
  • Os provedores de hiperescala (Meta, Google, Amazon, etc.) ditam os requisitos detalhados de armazenamento e armazenamento, e esses projetos personalizados acabam moldando o que as empresas recebem.
  • As especificações OCP ajudam a unificar e simplificar o caos, fornecendo a todos um alvo comum além do NVMe.
  • A indústria está ativamente tentando reduzir o número de SKUs e convergir para formatos modernos como o E3, mesmo que formatos antigos ainda persistam.

5:00–10:00: Unidades de armazenamento E3, E2 e de classe Petabyte

  • O formato E3 está se tornando o formato preferido para empresas que utilizam a tecnologia Gen6+, devido às suas melhores características de potência e térmicas.
  • Os drives de 2.5 polegadas continuarão disponíveis por muitos anos devido aos longos ciclos de vida dos produtos, mas os novos designs estão migrando para o formato EDSFF.
  • O E2 é um SSD de formato maior, com foco na capacidade, considerado um verdadeiro substituto para discos rígidos em capacidades extremas.
  • Com o empilhamento avançado de memória NAND, uma única unidade E2 poderia eventualmente atingir 1 PB.
  • Os provedores de hiperescala mitigam os riscos de unidades gigantes usando fragmentação (sharding), codificação de apagamento (erasure encoding) e análise preditiva; os tempos de reconstrução para SSDs enormes ainda são muito melhores do que para HDDs grandes.

10:00–15:00: O resfriamento líquido chega também aos SSDs.

  • Os sistemas de treinamento de IA estão impulsionando a adoção generalizada do resfriamento líquido, e isso agora se estende até o armazenamento.
  • Os SSDs no formato E3 estão sendo redesenhados para contato direto com placas frias (planicidade da superfície, materiais e detalhes do conector).
  • Os SSDs Gen5 com refrigeração líquida abrirão caminho para a Gen6, onde o consumo de energia e a geração de calor serão ainda maiores.
  • As empresas estão cautelosas quanto à introdução de água nos centros de dados, mas o aumento dos custos de energia e da densidade de GPUs tornará o resfriamento líquido cada vez mais difícil de evitar.

15:00–20:00: Armazenamento de IA: Capacidade, Desempenho e Tensão do Tecido

  • A IA impulsiona o armazenamento em dois eixos: capacidade massiva e desempenho muito alto.
  • O disco rígido de 245 TB da KIOXIA (com stacks QLC de 32 camadas) é voltado para data lakes e grandes repositórios, não apenas para cargas de trabalho genéricas.
  • Dentro de um computador moderno, o armazenamento pode atingir velocidades de 250 a 280 GB/s; o gargalo está cada vez mais na infraestrutura de rede, e não nos discos rígidos.
  • Os provedores de hiperescala estão correndo para adotar o 400/800 GbE e placas de rede/DPUs mais inteligentes, enquanto os clientes de médio porte têm dificuldades para acompanhar esse nível de investimento em infraestrutura.
  • Bancos de dados tradicionais e Fibre Channel permanecem, mas bancos de dados vetoriais e armazenamentos de dados centrados em IA estão entrando em cena.

20:00–25:00: Software mais inteligente e um verdadeiro superciclo Flash

  • A KIOXIA não está apenas enviando unidades de disco, mas também investindo em software (por exemplo, ISAAC) para reduzir as necessidades de HBM/DRAM, preservando o desempenho de IA.
  • A estratégia é holística: melhorar o custo e a eficiência em nível de sistema, e não apenas por meio de memória NAND mais rápida.
  • Novas fábricas de semicondutores, como a Kitakami (K2), estão aumentando a produção, mas os fornecedores estão cautelosos após os ciclos de expansão e recessão da era da Covid, que custaram ao setor cerca de US$ 30 bilhões.
  • A miniaturização da tecnologia NAND (mais camadas, litografia mais fina) está se tornando mais cara e acelerada, de modo que a oferta aumentará, mas de forma controlada.
  • Muitos veem isso como um "superciclo" de vários anos impulsionado pela IA e pelo crescimento de dados, e não apenas uma recuperação repentina normal de 1 a 2 anos.

25:00 – Fim: IA em todos os lugares, Flash vs. HDD e aprendizado com HPC

  • Os dados continuam a crescer e raramente são apagados; a IA está a chegar a todos os locais onde esses dados se encontram, incluindo a borda da cadeia de dados, as cópias de segurança e as camadas secundárias.
  • Os SSDs de alta capacidade podem fornecer cerca de 100 PB por rack, em comparação com vários racks de HDDs para a mesma capacidade, com desempenho e eficiência muito superiores.
  • O desempenho dos HDDs não escala com a capacidade; os SSDs oferecem IOPS/GB e taxa de transferência ordens de magnitude melhores, melhorando o TCO e favorecendo o uso de memória flash em larga escala.
  • Eventos como OCP e Supercomputing (SC) são onde o futuro se torna visível primeiro: racks amplos, barramentos de 800V, sistemas de refrigeração exóticos e projetos de energia inovadores.
  • As inovações em hiperescala e computação de alto desempenho (HPC) estão moldando de forma constante a aparência dos servidores e data centers empresariais "normais", com foco em resiliência e eficiência.

Envolva-se com a StorageReview

Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS feed

Haroldo Fritts

Estou na indústria de tecnologia desde que a IBM criou a Selectric. Minha formação, porém, é escrever. Então decidi sair do negócio de pré-vendas e voltar às minhas raízes, escrevendo um pouco, mas ainda envolvido com tecnologia.