Vandaag op SC20 lanceerde AMD wat het stoutmoedig verkondigt als 's werelds snelste HPC-versneller voor wetenschappelijk onderzoek met de AMD Instinct MI100. Ze hebben misschien gelijk, aangezien ze beweren dat dit de eerste x86-server-GPU is die de prestatiebarrière van 10 teraflops (FP64) overschrijdt. Het bedrijf kamt de nieuwe GPU's met zijn 2e generatie AMD EPYC CPU's evenals het ROCm 4.0 open softwareplatform om indrukwekkende nieuwe cijfers te behalen en om onderzoekers te helpen nieuwe ontdekkingen te doen vooruitlopend op het exascale-tijdperk.
Vandaag op SC20 lanceerde AMD wat het stoutmoedig verkondigt als 's werelds snelste HPC-versneller voor wetenschappelijk onderzoek met de AMD Instinct MI100. Ze hebben misschien gelijk, aangezien ze beweren dat dit de eerste x86-server-GPU is die de prestatiebarrière van 10 teraflops (FP64) overschrijdt. Het bedrijf kamt de nieuwe GPU's met zijn 2e generatie AMD EPYC CPU's evenals het ROCm 4.0 open softwareplatform om indrukwekkende nieuwe cijfers te behalen en om onderzoekers te helpen nieuwe ontdekkingen te doen vooruitlopend op het exascale-tijdperk.
Het is leuk om te zien dat de concurrentie zich verplaatst naar de high-end GPU-ruimte. Deze ruimte wordt al enkele jaren gedomineerd door één bedrijf. AMD betreedt de ruimte door gebruik te maken van zijn nieuwe AMD CDNA-architectuur voor de AMD Instinct MI100 GPU en deze vervolgens te combineren met zijn populaire en goed presterende AMD EPYC-processors. Deze combinatie levert naar verluidt tot 11.5 TFLOPS piek FP64-prestaties voor HPC en tot 46.1 TFLOPS piek FP32 Matrix-prestaties voor AI en machine learning-workloads. Het bedrijf claimt ook een bijna 7x boost in FP16 theoretische drijvende-kommaprestaties voor AI-trainingsworkloads (vergeleken met AMD's vorige generatie versnellers) met zijn nieuwe AMD Matrix Core-technologie.
Bovenop het GPU-nieuws rolt het bedrijf software voor exascale computing uit met zijn nieuwste AMD ROCm-ontwikkelaarssoftware. ROCm bestaat uit compilers, programmeer-API's en bibliotheken die exascale-ontwikkelaars helpen bij het maken van krachtige applicaties. De nieuwste versie, ROCm 4.0, is geoptimaliseerd voor het leveren van hoge prestaties op MI100-gebaseerde systemen, zoals PyTorch- en Tensorflow-frameworks.
AMD Instinct MI100 Specificaties
Bereken eenheden | Streamprocessors | FP64 TFLOPS (piek) | FP32 TFLOPS (piek) | FP32 Matrix-TFLOPS
(Top) |
FP16/FP16-matrix TFLOPS(Piek) |
INT4 | INT8 TOPS
(Top) |
bFloat16 TFLOP's
(Top) |
HBM2 ECC Geheugen |
Geheugenbandbreedte |
120 | 7680 | 11.5 | 23.1 | 46.1 | 184.6 | 184.6 | Tot 92.3 TFLOPS | 32GB | Tot 1.23TB/sec |
De belangrijkste mogelijkheden en kenmerken van de AMD Instinct MI100-versneller zijn onder meer:
- Gloednieuwe AMD CDNA-architectuur - Ontworpen om AMD GPU's van stroom te voorzien voor het exascale-tijdperk en in het hart van de MI100-versneller, biedt de AMD CDNA-architectuur uitzonderlijke prestaties en energie-efficiëntie
- Toonaangevende FP64- en FP32-prestaties voor HPC-workloads – Levert toonaangevende 11.5 TFLOPS piek FP64-prestaties en 23.1 TFLOPS piek FP32-prestaties, waardoor wetenschappers en onderzoekers over de hele wereld sneller ontdekkingen kunnen doen in sectoren als biowetenschappen, energie, financiën, academici, overheid, defensie en meer.
- Gloednieuwe Matrix Core-technologie voor HPC en AI – Supercharged prestaties voor een volledige reeks enkelvoudige en gemengde precisiematrixbewerkingen, zoals FP32, FP16, bFloat16, Int8 en Int4, ontworpen om de convergentie van HPC en AI te stimuleren.
- 2e generatie AMD Infinity Fabric-technologie – Instinct MI100 biedt ~2x de peer-to-peer (P2P) piek I/O-bandbreedte via PCIe 4.0 met tot 340 GB/s aan totale bandbreedte per kaart met drie AMD Infinity Fabric Links. In een server kunnen MI100 GPU's worden geconfigureerd met maximaal twee volledig verbonden quad GPU-hives, die elk tot 552 GB/s P2P I/O-bandbreedte bieden voor het snel delen van gegevens.
- Ultrasnel HBM2-geheugen – Beschikt over 32 GB HBM2-geheugen met hoge bandbreedte met een kloksnelheid van 1.2 GHz en levert een ultrahoge geheugenbandbreedte van 1.23 TB/s om grote gegevenssets te ondersteunen en knelpunten bij het verplaatsen van gegevens in en uit het geheugen te elimineren .
- Ondersteuning voor de nieuwste PCIe Gen 4.0 in de branche - Ontworpen met de nieuwste PCIe Gen 4.0-technologieondersteuning die tot 64 GB/s piek theoretische transportgegevensbandbreedte van CPU naar GPU biedt.
Beschikbaarheid
De AMD Instinct MI100-versnellers worden tegen het einde van het jaar verwacht in systemen van OEM- en ODM-partners in de zakelijke markten, waaronder Dell, Supermicro, GIGABYTE en HPE.
Neem contact op met StorageReview
Nieuwsbrief | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | Facebook | RSS Feed