Aujourd'hui au SC20, AMD a lancé ce qu'il proclame avec audace comme l'accélérateur HPC le plus rapide au monde pour la recherche scientifique avec l'AMD Instinct MI100. Ils ont peut-être raison car ils prétendent qu'il s'agit du premier GPU de serveur x86 à dépasser la barrière des performances de 10 téraflops (FP64). La société combine les nouveaux GPU avec ses Processeurs AMD EPYC de 2e génération ainsi que la plate-forme logicielle ouverte ROCm 4.0 pour atteindre de nouveaux chiffres impressionnants et aider les chercheurs à propulser de nouvelles découvertes avant l'ère de l'exascale.
Il est agréable de voir une certaine concurrence se déplacer dans l'espace GPU haut de gamme. Cet espace est dominé par une seule entreprise depuis plusieurs années. AMD entre dans l'espace en tirant parti de sa nouvelle architecture AMD CDNA pour le GPU AMD Instinct MI100, puis en la combinant avec ses processeurs AMD EPYC populaires et très performants. Cette combinaison est censée fournir jusqu'à 11.5 TFLOPS de performances maximales FP64 pour HPC et jusqu'à 46.1 TFLOPS de performances maximales FP32 Matrix pour les charges de travail d'IA et d'apprentissage automatique. La société revendique également une augmentation de près de 7 fois des performances théoriques maximales en virgule flottante du FP16 pour les charges de travail de formation d'IA (par rapport aux accélérateurs de la génération précédente d'AMD) avec sa nouvelle technologie AMD Matrix Core.
En plus de l'actualité du GPU, la société déploie un logiciel pour l'informatique exascale avec son dernier logiciel de développement AMD ROCm. ROCm se compose de compilateurs, d'API de programmation et de bibliothèques qui aident les développeurs exascale lorsqu'ils créent des applications hautes performances. La dernière version, ROCm 4.0, est optimisée pour offrir des performances élevées sur les systèmes basés sur MI100, tels que les frameworks PyTorch et Tensorflow.
Spécifications AMD Instinct MI100
| Unités de calcul | Processeurs de flux | FP64 TFLOPS (crête) | FP32 TFLOPS (crête) | Matrice FP32 TFLOPS (De pointe) | Matrice FP16/FP16 TFLOPS (crête) | INT4 | HAUTS INT8 (De pointe) | bFloat16 TFLOP (De pointe) | HBM2 ECC Mémoire | Bande passante mémoire |
| 120 | 7680 | Jusqu'à 11.5 | Jusqu'à 23.1 | Jusqu'à 46.1 | Jusqu'à 184.6 | Jusqu'à 184.6 | Jusqu'à 92.3 TFLOPS | 32GB | Jusqu'à 1.23 To/s |
Disponibilité
Les accélérateurs AMD Instinct MI100 sont attendus d'ici la fin de l'année dans les systèmes des partenaires OEM et ODM sur les marchés des entreprises, notamment Dell, Supermicro, GIGABYTE et HPE.
Intel a annoncé une série de mises à jour pour ses centres de données lors du Computex 2026 à Taipei, couvrant le calcul, la mise en réseau et son accélérateur d'IA…
NetApp et Cisco ont introduit un ensemble élargi de solutions validées FlexPod pour simplifier le déploiement d'une infrastructure d'IA sécurisée et évolutive.
Nutanix a annoncé que sa solution Nutanix Unified Storage (NUS) est désormais certifiée NVIDIA au niveau entreprise, validant ainsi la plateforme pour…
ZutaCore a levé 100 millions de dollars lors d'un tour de table de série C, avec la participation de Mitsubishi Electric, Carrier Ventures, Samsung Electronics et d'autres…
CoolIT Systems a annoncé le développement de ce qu'elle décrit comme la première conception de plaque froide à refroidissement liquide direct (DLC) de 15 kW…
L'infrastructure des services financiers continue d'être définie par la nécessité de traiter des modèles de risque plus vastes dans des limites de puissance et d'espace fixes…