Home EmpreendimentoAcessórios GPU AMD Instinct MI100 anunciada

GPU AMD Instinct MI100 anunciada

by Adam Armstrong
AMD Instinto MI100

Hoje no SC20, a AMD lançou o que está proclamando corajosamente como o acelerador HPC mais rápido do mundo para pesquisa científica com o AMD Instinct MI100. Eles podem estar corretos, pois afirmam que esta é a primeira GPU de servidor x86 a ultrapassar a barreira de desempenho de 10 teraflops (FP64). A empresa está combinando as novas GPUs com seus CPUs AMD EPYC de 2ª geração bem como a plataforma de software aberto ROCm 4.0 para atingir novos números impressionantes e ajudar os pesquisadores a impulsionar novas descobertas antes da era exascale.

Hoje no SC20, a AMD lançou o que está proclamando corajosamente como o acelerador HPC mais rápido do mundo para pesquisa científica com o AMD Instinct MI100. Eles podem estar corretos, pois afirmam que esta é a primeira GPU de servidor x86 a ultrapassar a barreira de desempenho de 10 teraflops (FP64). A empresa está combinando as novas GPUs com seus CPUs AMD EPYC de 2ª geração bem como a plataforma de software aberto ROCm 4.0 para atingir novos números impressionantes e ajudar os pesquisadores a impulsionar novas descobertas antes da era exascale.

AMD Instinto MI100

É bom ver alguma competição entrar no espaço da GPU de ponta. Este espaço foi dominado por uma única empresa durante vários anos. A AMD está entrando no espaço aproveitando sua nova arquitetura AMD CDNA para a GPU AMD Instinct MI100 e, em seguida, combinando-a com seus populares processadores AMD EPYC de alto desempenho. Diz-se que essa combinação fornece até 11.5 TFLOPS de desempenho máximo de FP64 para HPC e até 46.1 TFLOPS de desempenho máximo de FP32 Matrix para cargas de trabalho de IA e aprendizado de máquina. A empresa também reivindica um aumento de quase 7x no desempenho de ponto flutuante de pico teórico do FP16 para cargas de trabalho de treinamento de IA (em comparação com os aceleradores da geração anterior da AMD) com sua nova tecnologia AMD Matrix Core.

Além das novidades de GPU, a empresa está lançando software para computação exascale com seu mais recente software de desenvolvedor AMD ROCm. O ROCm consiste em compiladores, APIs de programação e bibliotecas que ajudam os desenvolvedores de exascale quando estão criando aplicativos de alto desempenho. A versão mais recente, ROCm 4.0, é otimizada para fornecer alto desempenho em sistemas baseados em MI100, como as estruturas PyTorch e Tensorflow.

Especificações do AMD Instinct MI100

Unidades de cálculo Processadores de fluxo FP64 TFLOPS (Pico) FP32 TFLOPS (Pico) FP32 Matriz TFLOPS

(Pico)

Matriz FP16/FP16
TFLOPS (pico)
INT4 | TOPOS INT8

(Pico)

bFloat16 TFLOPs

(Pico)

HBM2
ECC
Memória
Largura de banda de memória
120 7680 Até 11.5 Até 23.1 Até 46.1 Até 184.6 Até 184.6 Até 92.3 TFLOPS 32GB Até 1.23 TB/s

Os principais recursos e recursos do acelerador AMD Instinct MI100 incluem:

  • Arquitetura AMD CDNA totalmente nova - Projetada para alimentar GPUs AMD para a era exascale e no coração do acelerador MI100, a arquitetura AMD CDNA oferece desempenho e eficiência de energia excepcionais
  • Desempenho líder de FP64 e FP32 para cargas de trabalho de HPC – Oferece desempenho de FP11.5 de pico de 64 TFLOPS e desempenho de FP23.1 de pico de 32 TFLOPS, permitindo que cientistas e pesquisadores em todo o mundo acelerem descobertas em setores como ciências da vida, energia, finanças, acadêmicos, governo, defesa e mais.
  • Tecnologia Matrix Core totalmente nova para HPC e AI – Desempenho superalimentado para uma gama completa de operações de matriz de precisão única e mista, como FP32, FP16, bFloat16, Int8 e Int4, projetadas para aumentar a convergência de HPC e AI.
  • Tecnologia AMD Infinity Fabric de 2ª geração – O Instinct MI100 fornece ~2x a largura de banda I/O de pico ponto a ponto (P2P) sobre PCIe 4.0 com até 340 GB/s de largura de banda agregada por placa com três AMD Infinity Fabric Links. Em um servidor, as GPUs MI100 podem ser configuradas com até duas seções de GPU quádruplas totalmente conectadas, cada uma fornecendo até 552 GB/s de largura de banda de E/S P2P para compartilhamento rápido de dados.
  • Memória HBM2 ultrarrápida – Possui memória HBM32 de alta largura de banda de 2 GB a uma taxa de clock de 1.2 GHz e oferece uma largura de banda de memória ultra alta de 1.23 TB/s para suportar grandes conjuntos de dados e ajudar a eliminar gargalos na movimentação de dados para dentro e para fora da memória .
  • Suporte para PCIe Gen 4.0 mais recente do setor – Projetado com o suporte à tecnologia PCIe Gen 4.0 mais recente, fornecendo até 64 GB/s de largura de banda de dados de transporte teórico de CPU para GPU.

Disponibilidade

Os aceleradores AMD Instinct MI100 são esperados até o final do ano em sistemas de parceiros OEM e ODM nos mercados corporativos, incluindo Dell, Supermicro, GIGABYTE e HPE.

AMD

Envolva-se com a StorageReview

Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | Facebook | RSS feed