AMD a annoncé la disponibilité générale des nouveaux processeurs EPYC 9004 de 4e génération. Nommée AMD Genoa, la nouvelle gamme de processeurs prend en charge 12 canaux de DDR5-4800 (jusqu'à 6 To de capacité de mémoire par socket), 128 voies de PCIe Gen5, la technologie AMD Infinity Fabric/Guard et jusqu'à 96 cœurs. Cela les rend idéales pour les charges de travail critiques dans le cloud, l'entreprise et l'informatique haute performance.
AMD a annoncé la disponibilité générale des nouveaux processeurs EPYC 9004 de 4e génération. Nommée AMD Genoa, la nouvelle gamme de processeurs prend en charge 12 canaux de DDR5-4800 (jusqu'à 6 To de capacité de mémoire par socket), 128 voies de PCIe Gen5, la technologie AMD Infinity Fabric/Guard et jusqu'à 96 cœurs. Cela les rend idéales pour les charges de travail critiques dans le cloud, l'entreprise et l'informatique haute performance.
Avantages des processeurs EPYC 9004 de 4e génération pour les entreprises
Avec son énorme nombre de 96 cœurs dans un seul processeur, les nouveaux processeurs AMD Genoa permettront aux organisations de réduire leur empreinte physique en déployant moins de serveurs tout en tirant parti de serveurs plus puissants. Cela apporte une plus grande flexibilité aux écosystèmes des centres de données et les aide à atteindre leurs objectifs de durabilité et d'avenir.
AMD a construit ses nouveaux processeurs EPYC en mettant l'accent sur une sécurité renforcée, en particulier avec l'expansion d'AMD Infinity Guard, l'ensemble de fonctionnalités de la société qui offre des couches de protection physiques et virtuelles à leurs processeurs. Par exemple, il comporte deux fois plus de clés de chiffrement que les générations précédentes, ce qui aide les clients à sécuriser leurs données, qu'elles soient stockées localement, dans le cloud ou résidant dans le stockage.
Les organisations pourront bénéficier de leur ensemble de fonctionnalités « tout compris », avec des options pour choisir un modèle avec le nombre de cœurs et la fréquence (voir le tableau ci-dessous) qui répond le mieux à leurs besoins. De plus, les processeurs AMD EPYC de 4e génération prennent désormais en charge la mémoire DDR5 et PCIe Gen 5, qui sont toutes deux essentielles pour les applications d'IA et de ML. Bien sûr, les fournisseurs de SSD d'entreprise s'empressent de diffuser leurs disques au grand public, débloquant deux fois plus de potentiel de bande passante que la génération 4.
SKU AMD Genoa série 9004
Modèle | noyau | TDP par défaut | cTDP | Base (GHz) | Boost (GHz) |
9654 | 96 | 360w | 320-400w | 2.4 | 3.7 |
9634 | 84 | 290w | 240-300w | 2.25 | 3.7 |
9554 | 64 | 360w | 320-400w | 3.1 | 3.75 |
9534 | 64 | 280w | 240-300w | 2.45 | 3.7 |
9454 | 48 | 290w | 240-300w | 2.75 | 3.8 |
9354 | 32 | 280w | 240-300w | 3.25 | 3.8 |
9334 | 32 | 210w | 200-240w | 2.7 | 3.9 |
9254 | 24 | 200w | 200-240w | 2.9 | 4.15 |
9224 | 24 | 200w | 200-240w | 2.5 | 3.7 |
9124 | 16 | 200w | 200-240w | 3.0 | 3.7 |
9474F | 48 | 360w | 320-400w | 3.6 | 4.1 |
9374F | 32 | 320w | 320-400w | 3.85 | 4.3 |
9274F | 24 | 320w | 320-400w | 4.05 | 4.3 |
9174F | 16 | 320w | 320-400w | 4.1 | 4.4 |
9654P | 96 | 360w | 320-400w | 2.4 | 3.7 |
9554P | 64 | 360w | 320-400w | 3.1 | 3.75 |
9454P | 48 | 290w | 240-300w | 2.75 | 3.8 |
9354P | 32 | 280w | 240-300w | 3.25 | 3.8 |
AMD Gênes – Architecture Zen 4
Sorti en septembre dernier, Zen 4 est la nouvelle microarchitecture pour les processeurs AMD EPYC 9004, avec le cœur AMD le plus performant à ce jour. Cela aide les processeurs EPYC 9004 à offrir de nouveaux niveaux de leadership en matière de performances et d'efficacité énergétique et permet aux clients d'accélérer la modernisation du centre de données pour un débit d'application plus élevé et des informations plus exploitables. Zen 4 alimente également leurs nouveaux processeurs de bureau Ryzen 7000 grand public.
L'un des changements les plus importants apportés par Zen 4 est qu'il ne prend plus en charge la mémoire DDR4, car il est passé uniquement à la DDR5 uniquement. De plus, Zen 4 prend en charge les nouveaux profils AMD EXPO SPD, permettant un réglage et un overclocking plus complets de la mémoire par les fabricants de RAM.
Certaines des autres nouvelles fonctionnalités incluent:
- Cache L1 privé rapide de 2M
- Plus d'échecs exceptionnels pris en charge de L2 à L3 par cœur
- Plus de ratés exceptionnels pris en charge de L3 à la mémoire
- Amélioration de L3 et L2 miss BW
- Un BW plus élevé permet des améliorations de prélecture
Présentation de la microarchitecture Zen 4
Zen 4 contre Zen 3
Améliorations de la série AMD EPYC 9004 par rapport aux générations précédentes
Le nouveau AMD Genoa offre une gamme d'améliorations notables, notamment une augmentation du nombre maximal de cœurs à 96 par processeur. C'est significatif par rapport aux dernières générations :
- Maximum Noyaux 64 par CPU avec les 7773X et 7763 (3rd modèles Gen EPYC)
- Maximum Noyaux 40 par CPU avec le 8380 (3rd Modèle Gen Xeon Platinum)
AMD indique que cela se traduira par environ 2.3 fois les performances par rapport à ses concurrents (ou 1.6x pour les performances par watt) lorsqu'il s'agit de solutions plus rapides. Ce sera la plus grande amélioration des performances globales que nous ayons vue de leurs versions de nouvelle génération. Pour les opérations commerciales d'entreprise par seconde, les 4th La génération AMD s'attend à ce que ses processeurs EPYC offrent environ 2.6 fois les performances tout en faisant allusion à une augmentation des performances de 2.4 fois les vitesses de rendu lors de l'utilisation d'Arnold Autodesk.
Il offre également une mise à niveau significative des performances de base grâce à l'architecture Zen 4 et une augmentation potentielle d'environ 14 % de l'amélioration de l'IPC pour les processeurs de serveur.
La nouvelle série EPYC 9004 dispose également de capacités de plate-forme de leadership qui sont provisionnées pour évoluer :
- DDR12-5 à 4800 canaux avec des performances à rang unique améliorées
- SERDES multifonctions 128L 32Gps et 8L 8Gps (sérialiseur/désérialiseur)
De plus, il prend en charge la mémoire CXL1.1+ (CXL "Type3"), qui inclut une capacité d'attachement de mémoire avancée pour la DDR et la mémoire émergente, ainsi que les extensions SEV-SNP, QoS et de gestion de la mémoire à plusieurs niveaux. Pour une sécurité renforcée, il prend en charge les extensions de clé SEV-SNP et AES-256-XTS.
Mémoire AMD EPYC série 9004
Les processeurs AMD Genoa prennent en charge 12 canaux par processeur, une capacité de 6 To par socket, jusqu'à DDR4800, et peuvent également théoriquement atteindre jusqu'à 460 Go/s en bande passante maximale.
Voici un aperçu des comparaisons entre les performances de la bande passante mémoire de 3e génération et de 4e génération :
Positionnement du processeur AMD EPYC série 9004
Comme dans leur génération précédente, AMD a classé ses nouveaux processeurs en trois groupes différents :
- Performances de base, qui est composé de processeurs haute fréquence avec un grand rapport cache/cœur. Les modèles concernés incluent 9474F (48 cœurs à 360 W), 9374F (32 cœurs à 320 W), 9274F (24 cœurs à 320 W) et 9174F (16 cœurs à 320 W).
- Densité du noyau, qui comprend les processeurs avec le plus grand nombre de cœurs et de threads. Les modèles concernés incluent 9654/P (96 cœurs à 360 W), 9634 (84 cœurs à 290 W), 9554/P (64 cœurs à 360 W), 9534 (64 cœurs à 280 W) et 9454/P (48 cœurs à 290 W). ).
- Performances équilibrées et optimisées, composé de processeurs offrant un équilibre entre performances et coût total de possession. Les modèles concernés incluent 9354/P (32 cœurs à 280 W), 9334 (32 cœurs à 210 W), 9254 (24 cœurs à 200 W), 9224 (24 cœurs à 200 W) et 9124 (16 cœurs à 200 W).
Performances du processeur AMD Genoa 9004
Configuration de l'analyse comparative
Pour nos tests initiaux, nous avons positionné les plates-formes Intel et AMD haut de gamme actuelles les unes contre les autres dans un premier lot de charges de travail gourmandes en CPU. Pour notre plate-forme Intel, nous avons utilisé notre plate-forme initiale Intel 8380 à double processeur construite autour d'un serveur Intel OEM contre notre plate-forme AMD EPYC 9654 à double processeur dans un châssis Quanta.
Spécifications de la plate-forme Intel :
2 processeurs Intel Xeon Platinum 8380 à 40 cœurs
16 x 32 Go de mémoire DDR3200 à 4 XNUMX MHz
Système d'exploitation Windows Server 2022
Spécifications de la plate-forme AMD :
2 processeurs AMD EPYC 9654 à 96 cœurs
24 x 64 Go de mémoire DDR4800 à 5 XNUMX MHz
Système d'exploitation Windows Server 2022
V-Ray
V-Ray Benchmark est une application de Chaos Group pour noter et comparer différents CPU et GPU. Chaos Group est connu pour son travail autour des visualisations et du rendu spécialisé dans la technologie du ray tracing. Le V-Ray Benchmark contient une scène de test de construction personnalisée pour tester n'importe quelle combinaison de CPU et de GPU et comparer les performances d'un système par rapport à un autre.
Dans notre laboratoire, nous avons utilisé le benchmark V-Ray en mode CPU uniquement. Afin de minimiser tout goulot d'étranglement potentiel, nous avons utilisé un SSD Solidigm P5520 7.68 To NVMe et une installation propre de Windows Server 2022. Le haut du classement pour V-Ray était auparavant un système de processeur 2x AMD EPYC 7K83 64 cœurs qui a marqué un moyenne impressionnante de 100,844 6 sur 2 tests. Notre système d'échantillonnage avec 96x AMD EPYC Genoa 126,940-Core a obtenu une moyenne de 9 XNUMX sur XNUMX tests. Comparé au système Intel
Firefox construit à partir de la source
Firefox, le navigateur de Mozilla, est un énorme projet open source. Mozilla tient à vous offrir la possibilité de compiler vous-même le projet à partir du code source, ce qui est devenu plus omniprésent en tant qu'outil de comparaison des performances. Le téléchargement pour cela est de plusieurs gigaoctets avec des milliers de fichiers devant être compilés.
Lors de nos tests, nous avons été plus qu'impressionnés par le temps de 6 minutes et 57 secondes de la plate-forme Intel Xeon 8380, jusqu'à ce que nous la lancions sur la plate-forme Genoa, qui est arrivée à une vitesse incroyablement rapide de 6 minutes 33- deuxième temps de compilation. À titre de comparaison, un poste de travail de haut niveau sera en mesure d'accomplir cette tâche en à peine moins de 10 minutes si vous lui donnez un régime régulier d'azote liquide et de tension excessive, ce qui signifie que nous avons affaire à une puissance brute sérieuse dès le départ avec ces puces.
FF Construire à partir de la source | |
2 x AMD 9654 96 cœurs | 6:33.85 |
2 x Intel 8380 40 cœurs | 6:57.85 |
Blender – référence CLI
Blender Benchmark est une norme établie sur la scène des benchmarks CPU et GPU. Blender est un outil de modélisation et d'animation 3D open source très avancé et considéré comme un leader dans le domaine. Conformément au thème des processeurs Genoa EPYC, nous l'utilisons pour montrer la flexibilité d'avoir une architecture mixte capable d'un processeur et d'un potentiel GPU pour les déploiements de rack haute densité.
Blender a trois références, connues sous le nom de Monster, Junkshop et Classroom. Ce sont trois scènes qui sont rendues séquentiellement et qui reçoivent un score pour chaque section, qui est ensuite additionné pour un score total.
Test du mélangeur | 2 x AMD 9654 96 cœurs | 2 x Intel 8380 40 cœurs |
Monster | 1788.189128 | 671.145395 |
Brocanteur | 1062.533142 | 407.141514 |
Salle de classe | 850.646333 | 320.507039 |
Total | 3701.368603 | 1398.793948 |
Le gréement Genoa a obtenu un total écrasant de 3701, avec 1788.2 dans Monster, 1062.5 dans Junkshop et 850.6 sur la référence Classroom. Comparer Genoa à l'Intel Xeon Platinum peut sembler injuste à certains égards, étant donné qu'Intel ne se bat qu'avec environ 41% du nombre de cœurs, cependant, si nous examinons les données et normalisons la différence de nombre de cœurs, les résultats deviennent intéressants . La puce AMD Genoa, grâce à sa nouvelle architecture, ses jeux d'instructions et l'utilisation de la DDR5, est environ 10 % plus rapide que la plate-forme Intel.
2 x AMD 9654 96 cœurs | Pourcentage relatif du nombre de cœurs Intel | 2 x Intel 8380 40 cœurs |
192 Core | 41.67 pour cent | 80 Core |
384 discussion | 41.67 pour cent | 160 discussion |
2 x AMD 9654 96 cœurs | 2 x Intel 8380 40 cœurs | |
Score total du mélangeur | 3701 | 1399 |
Noyaux / Threads | 192/384 | 80/160 |
Nombre de cœurs Intel/AMD | 41.67 pour cent | |
Comparaison directe des scores Intel/AMD | 37.79 pour cent | |
Score AMD normalisé de base | 1542 | |
Intel/AMD relatif, cœur normalisé | 90.70 pour cent |
Cinebench R23
Cinebench de Maxon est un pilier de l'analyse comparative depuis un certain temps déjà, grâce à sa méthodologie de test standardisée et à l'utilisation de tests réels pour comparer les performances multicœurs et monocœurs. R23, la dernière itération de Cinebench, a une limitation que nous n'avons pas eu à contourner auparavant ; Il n'est capable de comparer que 256 cœurs/threads. Notre banc d'essai en a 384. Chose intéressante, il y avait beaucoup de benchmarks et d'applications «standards» que nous avons rencontrés et qui étaient plafonnés à 256, donc Cinebench n'est pas le seul à avoir besoin d'une mise à jour pour l'avenir ultra-core-count nous nous dirigeons vers.
Pour tenter de résoudre cette limitation, nous avons exécuté deux tests simultanément et limité chaque instance à 196 threads pour essayer de répartir la charge de manière égale. Habituellement, vous pouvez définir l'affinité CPU dans le Gestionnaire des tâches, cependant, quelque chose bloquait cette opération avec Cinebench, nous soupçonnons qu'il s'agit d'un indicateur qui a été défini dans la manière sous-jacente dont l'API est appelée pour la priorité CPU. Nous avons essayé de l'exécuter en tant qu'utilisateurs moins privilégiés et de le lancer avec l'indicateur de ligne de commande "start / affinity NODE 0" pour essayer de le forcer, mais nous n'avons pas pu verrouiller l'application sur un seul nœud NUMA.
Impossible d'attribuer une affinité spécifique pour le programme, nous avons juste exécuté l'application deux fois et les avons démarrés ensemble. Les résultats ont montré deux scores radicalement différents des deux instances de l'application, mais en surveillant l'utilisation du processeur, nous avons pu l'observer rebondir entre 80 et 100 % d'utilisation pendant le test.
Instance unique Cinebench | 2 x AMD 9654 96 cœurs | 2 x Intel 8380 40 cœurs |
Multi-fil (capuchon 256) | 85,160 | 70,540 |
Single Core | 972 | 985 |
Rapport PM | 87.65x | 71.63x |
2 instances Cinebench | ||
Essai AMD 1 | Essai AMD 2 | |
Score, 1ère instance | 82,063 | 68,231 |
Score, 2ème instance | 57,557 | 57,221 |
Total | 139,620 | 125,452 |
Réflexions finales
Le processus d'analyse comparative des processeurs AMD EPYC 9004 a été un exercice intéressant, c'est le moins qu'on puisse dire. Les défis auxquels nous avons été confrontés au cours du processus d'examen précoce sont révélateurs des défis globaux que les développeurs de logiciels devront relever à mesure que le paysage du processeur passera au modèle ultra-haute densité. Bien qu'il existe des applications prêtes à l'emploi qui peuvent l'utiliser, nous avons de plus en plus trouvé des limites de logiciels incapables de dépasser certains seuils de nombre de threads.
Dans le laboratoire, nous travaillons sur des benchmarks maison de Tensorflow Machine Learning pour pouvoir tester ces nouveaux processeurs dans des scénarios réels. Nous ferons un suivi avec les résultats lorsque nous aurons confiance dans les résultats de la nouvelle application et que nous l'aurons validée sur plusieurs plates-formes et générations de processeurs.
Pour l'instant cependant, le lancement d'AMD Genoa est très excitant comme nous l'avons vu jusqu'à présent avec le serveur Quanta. Plus, HPE et Dell ont annoncé leurs serveurs, chacun offrant quatre systèmes, deux châssis à 1 CPU et deux châssis à 2 CPU. Cela apportera immédiatement AMD Genoa à l'entreprise, élargissant rapidement l'empreinte de Genoa au-delà des hyperscalers.
La grande question est alors évidente : AMD Genoa vaut-il l'investissement ? Cela dépendra de la charge de travail en termes de justification des dépenses, mais tout comme DPU pour VMware, ces nouvelles technologies CPU ont beaucoup à offrir en termes de puissance de calcul, de sécurité et d'efficacité. Remplacer l'EPYC de 3e génération par ceux-ci est probablement un peu prématuré, mais quiconque attend une raison de sauter devrait être très heureux de voir ce que Gênes a apporté à la table.
Nous avons beaucoup plus de tests et de travail à faire et avec Intel Sapphire Rapids à venir, nous voudrons comparer le meilleur que chacun a à fournir. Mais pour l'instant, AMD Genoa est extrêmement convaincant et devrait figurer dans tout PoC de rafraîchissement d'infrastructure afin que les organisations puissent mieux comprendre l'impact de tous ces cœurs et efficacités qu'AMD a à offrir.
S'engager avec StorageReview
Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | Flux RSS