Accueil Entreprise Test AMD Bergame/Genoa-X

Test AMD Bergame/Genoa-X

by Jordan Ranous

En juin, AMD a annoncé des mises à jour de son Famille AMD EPYC de 4e génération de processeurs conçus pour les charges de travail spécialisées nécessaires pour répondre aux besoins des entreprises. Les annonces ont été faites lors de l'ouverture du centre de données et de la technologie AI d'AMD avec le dévoilement des processeurs AMD EPYC 4X97 de 4e génération, précédemment nommés AMD Bergamo. Les processeurs AMD EPYC 97X4 offrent une plus grande densité de vCPU et des performances accrues ciblant les applications d'IA et les applications exécutées dans le cloud.

En juin, AMD a annoncé des mises à jour de son Famille AMD EPYC de 4e génération de processeurs conçus pour les charges de travail spécialisées nécessaires pour répondre aux besoins des entreprises. Les annonces ont été faites lors de l'ouverture du centre de données et de la technologie AI d'AMD avec le dévoilement des processeurs AMD EPYC 4X97 de 4e génération, précédemment nommés AMD Bergamo. Les processeurs AMD EPYC 97X4 offrent une plus grande densité de vCPU et des performances accrues ciblant les applications d'IA et les applications exécutées dans le cloud.

AMD Bergame

Les processeurs AMD EPYC Zen 4, équipés de 3D V-Cache, nom de code Genoa-X, ont été identifiés comme le principal processeur de serveur x86 pour le calcul technique dans une récente SPEC.org rapport. Ces processeurs apportent 3D V-Cache aux puces Zen 96 à 4 cœurs et sont parfaitement adaptés aux charges de travail informatiques techniques exigeantes.

Selon AMD, l'alignement de sa feuille de route de produits sur les environnements des clients peut fournir les performances nécessaires aux charges de travail informatiques à usage général, natives du cloud et techniques. AMD a adopté la position selon laquelle une taille unique ne convient pas à tous. Ces nouveaux processeurs AMD EPYC ont été conçus autour de ce concept pour offrir des performances accrues pour des charges de travail spécifiques.

Les applications sont de plus en plus conçues pour les charges de travail natives du cloud, permettant un développement, un déploiement et des mises à jour rapides. Les processeurs AMD EPYC 97X4, avec 128 cœurs, peuvent offrir un meilleur débit, jusqu'à 3.7 fois plus de performances pour les principales charges de travail natives du cloud par rapport à Ampere.

Modèle noyau Nombre maximum de fils TDP par défaut (W) Fréquence de base (GHz) Boost Freq1 (GHz) Cache L3 (Mo)
9754 128 256 360W 2.25 3.10 256
9754S 128 128 360W 2.25 3.10 256
9734 112 224 320W 2.20 3.00 256

Répondant au besoin d'itérations de conception plus rapides et de simulations complètes, les processeurs AMD EPYC de 4e génération avec 3D V-Cache offrent un processeur x86 de premier ordre pour les charges de travail informatiques techniques telles que la dynamique des fluides computationnelle (CFD), l'analyse par éléments finis (FEA) , l'automatisation de la conception électronique (EDA) et l'analyse structurelle. Ces processeurs ont jusqu'à 96 cœurs "Zen 4" et 1 Go + de cache L3 et peuvent considérablement accélérer le développement de produits.

Modèle noyau Nombre maximum de fils TDP par défaut (W) Fréquence de base (GHz) Boost Freq1 (GHz) Cache L3 (Mo)
9684X 96 192 400W 2.55 3.70 1,152
9384X 32 64 320W 3.10 3.90 768
9184X 16 32 320W 3.55 4.20 768

Benchmarks AMD Bergame et Genoa-X

Nous avons testé deux nouveaux processeurs et simulé un troisième en désactivant SMT. Dans le laboratoire, nous avions le 9754, une puce Bergamo à 128 cœurs et 256 threads, et le 9684X, une puce Genoa-X à 96 cœurs et 192 threads avec un énorme 1.1 Go de cache 3D L3 et une horloge plus élevée que le Genoa. Pour simuler le troisième, nous avons désactivé SMT sur notre 9754 car AMD a également sorti la puce 9754S Bergamo, qui est livrée sans multithreading et qui n'est que des cœurs purs. Nos tests de la puce SMT désactivée seront séparés de cet examen.

Nous avons effectué un ensemble complet de tests de performance pour évaluer les performances des nouveaux processeurs AMD Bergamo et Genoa-X. Nous avons commencé par des tests Cinebench R23 sur des configurations multicœur et monocœur, qui ont fourni des informations précieuses sur les capacités de rendu de ces processeurs.

Il semble que l'application, Cinebench R23, soit elle-même limitée dans la façon dont elle peut gérer autant de threads. Nous avons noté un plafond sur 128 cœurs, mais le cache 96D Genoa-X à 3 cœurs brille vraiment par ses performances, des thèmes qui seront communs à tous les tests.

Ensuite, nous avons exécuté y-cruncher à des niveaux de 1 milliard et 10 milliards de chiffres pour évaluer leurs prouesses de calcul, en particulier pour les tâches impliquant un degré élevé de calcul des nombres.

Plus bas, c'est mieux ici, nos résultats Genoa à 2 processeurs 96 cœurs sont après quelques réglages approfondis et ont pu afficher de bons chiffres, et la configuration de stock des puces Genoa-X et Bergamo montre un potentiel prometteur de réglage et de peaufinage pour mettre des chiffres record encore plus impressionnants.

Nous avons ensuite utilisé les benchmarks Blender, en particulier les tests Monster, Junkshop et Classroom, pour mesurer les performances de ces processeurs dans des scénarios de rendu graphiquement intensifs.

Dans le benchmark Blender, la puissance brute de 512 threads s'est vraiment manifestée, une fois de plus en tête des classements avec juste une configuration de stock.

Enfin, nous avons effectué des tests CPU Geekbench 6, connus pour leur large examen des performances du processeur dans les opérations monocœur et multicœur. Cette suite de tests nous a fourni une vue complète des capacités globales, des points forts et de l'amélioration progressive des processeurs AMD Bergamo et Genoa-X.

Aperçu des performances

Voici les scores bruts pour chacun des benchmarks. Gardez à l'esprit que nous avons eu des mois pour régler et configurer le système Genoa à 96 cœurs, et n'avons exécuté qu'une configuration de stock du nouveau AMD Bergamo.

référence 2p/96c Gênes 1p/96c Gênes-X 1p/128c Bergame 2p/128c Bergame
Cinebench R23 Multi 116744 93720 103876 102125
Cinebench R23 Single 1294 1301 1098 1089
Rapport MP Cinebench 90.22 72.04 94.65 93.75
croque-y 1b 8.882 10.296 9.568 9.184
croque-y 10b 51.071 72.377 80.171 55.683
Monstre du mélangeur 1700.647985 879.580323 1031.49474 2038.714424
Mélangeur Junkshop 1101.839271 605.445705 704.167826 1382.575225
Salle de classe Blender 869.476693 421.318478 506.665693 1045.959162
Geekbench 6 CPU unique 2048 2093 1738 1723
Geekbench 6 multi-processeur 20217 21329 18683 17916

AMD Bergame pour l'IA

Doté d'une gamme de moteurs d'inférence IA de fournisseurs de premier plan, le Référence d'inférence UL Procyon AI répond à un large éventail de configurations et d'exigences matérielles. Le score de référence fournit un résumé pratique et standardisé des performances d'inférence sur l'appareil. Cela nous permet de comparer et de contraster différentes configurations matérielles dans des situations réelles sans nécessiter de solutions internes.

Processeur Modèle Temps d'inférence moyen Temps d'inférence médian Nombre total d'inférences
2p/96c Gênes Mobile Net V3 3.61 ms 3.63 ms 45,800
1p/96c Gênes-X Mobile Net V3 2.71 ms 2.72 ms 58,631
1p/128c Bergame Mobile Net V3 3.90 ms 3.91 ms 41,538
2p/128c Bergame Mobile Net V3 4.10 ms 4.16 ms 40,008
2p/96c Gênes ResNet 50 6.36 ms 6.34 ms 26,525
1p/96c Gênes-X ResNet 50 6.66 ms 6.64 ms 25,049
1p/128c Bergame ResNet 50 10.14 ms 10.08 ms 16,919
2p/128c Bergame ResNet 50 8.21 ms 8.22 ms 20,842
2p/96c Gênes Création V4 25.98 ms 25.99 ms 6,555
1p/96c Gênes-X Création V4 29.19 ms 29.18 ms 5,879
1p/128c Bergame Création V4 33.17 ms 33.04 ms 5,158
2p/128c Bergame Création V4 30.63 ms 30.68 ms 5,573
2p/96c Gênes Deep Lab V3 25.51 ms 25.33 ms 5,660
1p/96c Gênes-X Deep Lab V3 28.26 ms 27.86 ms 5,394
1p/128c Bergame Deep Lab V3 32.16 ms 32.09 ms 4,708
2p/128c Bergame Deep Lab V3 31.16 ms 30.57 ms 4,807
2p/96c Gênes YOLO V3 34.10 ms 34.13 ms 4,818
1p/96c Gênes-X YOLO V3 43.59 ms 43.58 ms 3,831
1p/128c Bergame YOLO V3 44.50 ms 44.39 ms 3,739
2p/128c Bergame YOLO V3 41.35 ms 41.38 ms 4,001
2p/96c Gênes Réel-ESRGAN 2540.04 ms 2524.03 ms 71
1p/96c Gênes-X Réel-ESRGAN 3725.07 ms 3720.35 ms 49
1p/128c Bergame Réel-ESRGAN 2734.77 ms 2717.41 ms 66
2p/128c Bergame Réel-ESRGAN 2291.66 ms 2301.35 ms 79

Réflexions finales

Nos tests avec le nouveau processeur AMD Bergamo à 128 cœurs reflètent les gains attendus de la hausse du nombre de cœurs. En ce qui concerne les performances brutes, le nouveau processeur a géré les données et les tâches gourmandes en calcul avec une facilité qui semblait presque sans effort. Nos essais avec des applications de rendu et de calcul 3D, en particulier, ont montré les véritables prouesses de ces cœurs supplémentaires.

Nous avons noté une augmentation significative des vitesses de traitement par rapport au Genoa à 96 cœurs, avec et sans SMT activé, soulignant l'efficacité de la conception des puces d'AMD. Alors que nous plongeons plus profondément dans l'ère de l'informatique avancée à très haut nombre de cœurs, ce monstre à 128 cœurs et 256 threads établit une nouvelle référence en matière de densité de rack.

S'engager avec StorageReview

Newsletter |  YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | Flux RSS