Entreprise

Annonce du processeur graphique AMD Instinct MI100

Aujourd'hui au SC20, AMD a lancé ce qu'il proclame avec audace comme l'accélérateur HPC le plus rapide au monde pour la recherche scientifique avec l'AMD Instinct MI100. Ils ont peut-être raison car ils prétendent qu'il s'agit du premier GPU de serveur x86 à dépasser la barrière des performances de 10 téraflops (FP64). La société combine les nouveaux GPU avec ses Processeurs AMD EPYC de 2e génération ainsi que la plate-forme logicielle ouverte ROCm 4.0 pour atteindre de nouveaux chiffres impressionnants et aider les chercheurs à propulser de nouvelles découvertes avant l'ère de l'exascale.

Il est agréable de voir une certaine concurrence se déplacer dans l'espace GPU haut de gamme. Cet espace est dominé par une seule entreprise depuis plusieurs années. AMD entre dans l'espace en tirant parti de sa nouvelle architecture AMD CDNA pour le GPU AMD Instinct MI100, puis en la combinant avec ses processeurs AMD EPYC populaires et très performants. Cette combinaison est censée fournir jusqu'à 11.5 TFLOPS de performances maximales FP64 pour HPC et jusqu'à 46.1 TFLOPS de performances maximales FP32 Matrix pour les charges de travail d'IA et d'apprentissage automatique. La société revendique également une augmentation de près de 7 fois des performances théoriques maximales en virgule flottante du FP16 pour les charges de travail de formation d'IA (par rapport aux accélérateurs de la génération précédente d'AMD) avec sa nouvelle technologie AMD Matrix Core.

En plus de l'actualité du GPU, la société déploie un logiciel pour l'informatique exascale avec son dernier logiciel de développement AMD ROCm. ROCm se compose de compilateurs, d'API de programmation et de bibliothèques qui aident les développeurs exascale lorsqu'ils créent des applications hautes performances. La dernière version, ROCm 4.0, est optimisée pour offrir des performances élevées sur les systèmes basés sur MI100, tels que les frameworks PyTorch et Tensorflow.

Spécifications AMD Instinct MI100

Unités de calcul Processeurs de flux FP64 TFLOPS (crête) FP32 TFLOPS (crête) Matrice FP32 TFLOPS

(De pointe)

Matrice FP16/FP16
TFLOPS (crête)
INT4 | HAUTS INT8

(De pointe)

bFloat16 TFLOP

(De pointe)

HBM2
ECC
Mémoire
Bande passante mémoire
120 7680 Jusqu'à 11.5 Jusqu'à 23.1 Jusqu'à 46.1 Jusqu'à 184.6 Jusqu'à 184.6 Jusqu'à 92.3 TFLOPS 32GB Jusqu'à 1.23 To/s

Les principales capacités et fonctionnalités de l'accélérateur AMD Instinct MI100 incluent :

  • Toute nouvelle architecture AMD CDNA - Conçue pour alimenter les GPU AMD pour l'ère exascale et au cœur de l'accélérateur MI100, l'architecture AMD CDNA offre des performances et une efficacité énergétique exceptionnelles
  • Performances FP64 et FP32 de pointe pour les charges de travail HPC - Offre des performances FP11.5 de pointe de 64 TFLOPS et des performances FP23.1 de pointe de 32 TFLOPS, permettant aux scientifiques et aux chercheurs du monde entier d'accélérer les découvertes dans des secteurs tels que les sciences de la vie, l'énergie, la finance, les universités, le gouvernement, la défense et plus.
  • Toute nouvelle technologie Matrix Core pour HPC et AI - Performances suralimentées pour une gamme complète d'opérations matricielles de précision simples et mixtes, telles que FP32, FP16, bFloat16, Int8 et Int4, conçues pour stimuler la convergence du HPC et de l'IA.
  • Technologie AMD Infinity Fabric de 2e génération - Instinct MI100 fournit environ 2 fois la bande passante d'E/S de pointe peer-to-peer (P2P) sur PCIe 4.0 avec jusqu'à 340 Go/s de bande passante agrégée par carte avec trois AMD Infinity Fabric Links. Dans un serveur, les GPU MI100 peuvent être configurés avec jusqu'à deux ruches quad GPU entièrement connectées, chacune fournissant jusqu'à 552 Go/s de bande passante d'E/S P2P pour un partage rapide des données.
  • Mémoire HBM2 ultra-rapide - Dispose d'une mémoire HBM32 à large bande passante de 2 Go à une fréquence d'horloge de 1.2 GHz et offre une bande passante mémoire ultra-élevée de 1.23 To/s pour prendre en charge de grands ensembles de données et aider à éliminer les goulots d'étranglement dans le déplacement des données vers et hors de la mémoire .
  • Prise en charge de la dernière génération PCIe Gen 4.0 de l'industrie - Conçu avec la dernière technologie PCIe Gen 4.0, offrant jusqu'à 64 Go/s de bande passante de données de transport théorique maximale du CPU au GPU.

Disponibilité

Les accélérateurs AMD Instinct MI100 sont attendus d'ici la fin de l'année dans les systèmes des partenaires OEM et ODM sur les marchés des entreprises, notamment Dell, Supermicro, GIGABYTE et HPE.

AMD

Adam Armstrong

Adam est le rédacteur en chef des actualités de StorageReview.com, gérant nos équipes de contenu internes et indépendantes.

Derniers Articles

Intel lance le Xeon 6+ sur le serveur 18A avec 288 cœurs E, Ethernet 200 GbE E835 et GPU Crescent Island. Détails techniques

Intel a annoncé une série de mises à jour pour ses centres de données lors du Computex 2026 à Taipei, couvrant le calcul, la mise en réseau et son accélérateur d'IA…

Il y a 2 jours

NetApp et Cisco étendent FlexPod avec des architectures d'IA validées et la réponse de stockage SOAR de Splunk

NetApp et Cisco ont introduit un ensemble élargi de solutions validées FlexPod pour simplifier le déploiement d'une infrastructure d'IA sécurisée et évolutive.

Il y a 2 jours

Nutanix Unified Storage obtient la certification NVIDIA de niveau entreprise pour les charges de travail d'IA en production

Nutanix a annoncé que sa solution Nutanix Unified Storage (NUS) est désormais certifiée NVIDIA au niveau entreprise, validant ainsi la plateforme pour…

Il y a 2 jours

ZutaCore lève 100 millions de dollars en série C pour développer une solution de refroidissement diphasique sans eau pour les centres de données d'IA.

ZutaCore a levé 100 millions de dollars lors d'un tour de table de série C, avec la participation de Mitsubishi Electric, Carrier Ventures, Samsung Electronics et d'autres…

Il y a 3 jours

CoolIT Systems présente une plaque froide de 15 kW, étendant la durée de vie du DLC monophasé au-delà de 2030.

CoolIT Systems a annoncé le développement de ce qu'elle décrit comme la première conception de plaque froide à refroidissement liquide direct (DLC) de 15 kW…

Il y a 3 jours

Record HPE XD230 STAC-A2 : Intel Xeon 6980P et Micron MRDIMM en tête des indicateurs de risque financier

L'infrastructure des services financiers continue d'être définie par la nécessité de traiter des modèles de risque plus vastes dans des limites de puissance et d'espace fixes…

Il y a 4 jours