En juin, AMD a annoncé des mises à jour de son Famille AMD EPYC de 4e génération de processeurs conçus pour les charges de travail spécialisées nécessaires pour répondre aux besoins des entreprises. Les annonces ont été faites lors de l'ouverture du centre de données et de la technologie AI d'AMD avec le dévoilement des processeurs AMD EPYC 4X97 de 4e génération, précédemment nommés AMD Bergamo. Les processeurs AMD EPYC 97X4 offrent une plus grande densité de vCPU et des performances accrues ciblant les applications d'IA et les applications exécutées dans le cloud.
En juin, AMD a annoncé des mises à jour de son Famille AMD EPYC de 4e génération de processeurs conçus pour les charges de travail spécialisées nécessaires pour répondre aux besoins des entreprises. Les annonces ont été faites lors de l'ouverture du centre de données et de la technologie AI d'AMD avec le dévoilement des processeurs AMD EPYC 4X97 de 4e génération, précédemment nommés AMD Bergamo. Les processeurs AMD EPYC 97X4 offrent une plus grande densité de vCPU et des performances accrues ciblant les applications d'IA et les applications exécutées dans le cloud.
AMD Bergame
Les processeurs AMD EPYC Zen 4, équipés de 3D V-Cache, nom de code Genoa-X, ont été identifiés comme le principal processeur de serveur x86 pour le calcul technique dans une récente SPEC.org rapport. Ces processeurs apportent 3D V-Cache aux puces Zen 96 à 4 cœurs et sont parfaitement adaptés aux charges de travail informatiques techniques exigeantes.
Selon AMD, l'alignement de sa feuille de route de produits sur les environnements des clients peut fournir les performances nécessaires aux charges de travail informatiques à usage général, natives du cloud et techniques. AMD a adopté la position selon laquelle une taille unique ne convient pas à tous. Ces nouveaux processeurs AMD EPYC ont été conçus autour de ce concept pour offrir des performances accrues pour des charges de travail spécifiques.
Les applications sont de plus en plus conçues pour les charges de travail natives du cloud, permettant un développement, un déploiement et des mises à jour rapides. Les processeurs AMD EPYC 97X4, avec 128 cœurs, peuvent offrir un meilleur débit, jusqu'à 3.7 fois plus de performances pour les principales charges de travail natives du cloud par rapport à Ampere.
Modèle | Noyau | Nombre maximum de fils | TDP par défaut (W) | Fréquence de base (GHz) | Boost Freq1 (GHz) | Cache L3 (Mo) |
9754 | 128 | 256 | 360W | 2.25 | 3.10 | 256 |
9754S | 128 | 128 | 360W | 2.25 | 3.10 | 256 |
9734 | 112 | 224 | 320W | 2.20 | 3.00 | 256 |
Répondant au besoin d'itérations de conception plus rapides et de simulations complètes, les processeurs AMD EPYC de 4e génération avec 3D V-Cache offrent un processeur x86 de premier ordre pour les charges de travail informatiques techniques telles que la dynamique des fluides computationnelle (CFD), l'analyse par éléments finis (FEA) , l'automatisation de la conception électronique (EDA) et l'analyse structurelle. Ces processeurs ont jusqu'à 96 cœurs "Zen 4" et 1 Go + de cache L3 et peuvent considérablement accélérer le développement de produits.
Modèle | Noyau | Nombre maximum de fils | TDP par défaut (W) | Fréquence de base (GHz) | Boost Freq1 (GHz) | Cache L3 (Mo) |
9684X | 96 | 192 | 400W | 2.55 | 3.70 | 1,152 |
9384X | 32 | 64 | 320W | 3.10 | 3.90 | 768 |
9184X | 16 | 32 | 320W | 3.55 | 4.20 | 768 |
Benchmarks AMD Bergame et Genoa-X
Nous avons testé deux nouveaux processeurs et simulé un troisième en désactivant SMT. Dans le laboratoire, nous avions le 9754, une puce Bergamo à 128 cœurs et 256 threads, et le 9684X, une puce Genoa-X à 96 cœurs et 192 threads avec un énorme 1.1 Go de cache 3D L3 et une horloge plus élevée que le Genoa. Pour simuler le troisième, nous avons désactivé SMT sur notre 9754 car AMD a également sorti la puce 9754S Bergamo, qui est livrée sans multithreading et qui n'est que des cœurs purs. Nos tests de la puce SMT désactivée seront séparés de cet examen.
Nous avons effectué un ensemble complet de tests de performance pour évaluer les performances des nouveaux processeurs AMD Bergamo et Genoa-X. Nous avons commencé par des tests Cinebench R23 sur des configurations multicœur et monocœur, qui ont fourni des informations précieuses sur les capacités de rendu de ces processeurs.
Il semble que l'application, Cinebench R23, soit elle-même limitée dans la façon dont elle peut gérer autant de threads. Nous avons noté un plafond sur 128 cœurs, mais le cache 96D Genoa-X à 3 cœurs brille vraiment par ses performances, des thèmes qui seront communs à tous les tests.
Ensuite, nous avons exécuté y-cruncher à des niveaux de 1 milliard et 10 milliards de chiffres pour évaluer leurs prouesses de calcul, en particulier pour les tâches impliquant un degré élevé de calcul des nombres.
Plus bas, c'est mieux ici, nos résultats Genoa à 2 processeurs 96 cœurs sont après quelques réglages approfondis et ont pu afficher de bons chiffres, et la configuration de stock des puces Genoa-X et Bergamo montre un potentiel prometteur de réglage et de peaufinage pour mettre des chiffres record encore plus impressionnants.
Nous avons ensuite utilisé les benchmarks Blender, en particulier les tests Monster, Junkshop et Classroom, pour mesurer les performances de ces processeurs dans des scénarios de rendu graphiquement intensifs.
Dans le benchmark Blender, la puissance brute de 512 threads s'est vraiment manifestée, une fois de plus en tête des classements avec juste une configuration de stock.
Enfin, nous avons effectué des tests CPU Geekbench 6, connus pour leur large examen des performances du processeur dans les opérations monocœur et multicœur. Cette suite de tests nous a fourni une vue complète des capacités globales, des points forts et de l'amélioration progressive des processeurs AMD Bergamo et Genoa-X.
Aperçu des performances
Voici les scores bruts pour chacun des benchmarks. Gardez à l'esprit que nous avons eu des mois pour régler et configurer le système Genoa à 96 cœurs, et n'avons exécuté qu'une configuration de stock du nouveau AMD Bergamo.
référence | 2p/96c Gênes | 1p/96c Gênes-X | 1p/128c Bergame | 2p/128c Bergame | |
---|---|---|---|---|---|
Cinebench R23 Multi | 116744 | 93720 | 103876 | 102125 | |
Cinebench R23 Single | 1294 | 1301 | 1098 | 1089 | |
Rapport MP Cinebench | 90.22 | 72.04 | 94.65 | 93.75 | |
croque-y 1b | 8.882 | 10.296 | 9.568 | 9.184 | |
croque-y 10b | 51.071 | 72.377 | 80.171 | 55.683 | |
Monstre du mélangeur | 1700.647985 | 879.580323 | 1031.49474 | 2038.714424 | |
Mélangeur Junkshop | 1101.839271 | 605.445705 | 704.167826 | 1382.575225 | |
Salle de classe Blender | 869.476693 | 421.318478 | 506.665693 | 1045.959162 | |
Geekbench 6 CPU unique | 2048 | 2093 | 1738 | 1723 | |
Geekbench 6 multi-processeur | 20217 | 21329 | 18683 | 17916 |
AMD Bergame pour l'IA
Doté d'une gamme de moteurs d'inférence IA de fournisseurs de premier plan, le Référence d'inférence UL Procyon AI répond à un large éventail de configurations et d'exigences matérielles. Le score de référence fournit un résumé pratique et standardisé des performances d'inférence sur l'appareil. Cela nous permet de comparer et de contraster différentes configurations matérielles dans des situations réelles sans nécessiter de solutions internes.
Processeur | Modèle | Temps d'inférence moyen | Temps d'inférence médian | Nombre total d'inférences |
---|---|---|---|---|
2p/96c Gênes | Mobile Net V3 | 3.61 ms | 3.63 ms | 45,800 |
1p/96c Gênes-X | Mobile Net V3 | 2.71 ms | 2.72 ms | 58,631 |
1p/128c Bergame | Mobile Net V3 | 3.90 ms | 3.91 ms | 41,538 |
2p/128c Bergame | Mobile Net V3 | 4.10 ms | 4.16 ms | 40,008 |
2p/96c Gênes | ResNet 50 | 6.36 ms | 6.34 ms | 26,525 |
1p/96c Gênes-X | ResNet 50 | 6.66 ms | 6.64 ms | 25,049 |
1p/128c Bergame | ResNet 50 | 10.14 ms | 10.08 ms | 16,919 |
2p/128c Bergame | ResNet 50 | 8.21 ms | 8.22 ms | 20,842 |
2p/96c Gênes | Création V4 | 25.98 ms | 25.99 ms | 6,555 |
1p/96c Gênes-X | Création V4 | 29.19 ms | 29.18 ms | 5,879 |
1p/128c Bergame | Création V4 | 33.17 ms | 33.04 ms | 5,158 |
2p/128c Bergame | Création V4 | 30.63 ms | 30.68 ms | 5,573 |
2p/96c Gênes | Deep Lab V3 | 25.51 ms | 25.33 ms | 5,660 |
1p/96c Gênes-X | Deep Lab V3 | 28.26 ms | 27.86 ms | 5,394 |
1p/128c Bergame | Deep Lab V3 | 32.16 ms | 32.09 ms | 4,708 |
2p/128c Bergame | Deep Lab V3 | 31.16 ms | 30.57 ms | 4,807 |
2p/96c Gênes | YOLO V3 | 34.10 ms | 34.13 ms | 4,818 |
1p/96c Gênes-X | YOLO V3 | 43.59 ms | 43.58 ms | 3,831 |
1p/128c Bergame | YOLO V3 | 44.50 ms | 44.39 ms | 3,739 |
2p/128c Bergame | YOLO V3 | 41.35 ms | 41.38 ms | 4,001 |
2p/96c Gênes | Réel-ESRGAN | 2540.04 ms | 2524.03 ms | 71 |
1p/96c Gênes-X | Réel-ESRGAN | 3725.07 ms | 3720.35 ms | 49 |
1p/128c Bergame | Réel-ESRGAN | 2734.77 ms | 2717.41 ms | 66 |
2p/128c Bergame | Réel-ESRGAN | 2291.66 ms | 2301.35 ms | 79 |
Réflexions finales
Nos tests avec le nouveau processeur AMD Bergamo à 128 cœurs reflètent les gains attendus de la hausse du nombre de cœurs. En ce qui concerne les performances brutes, le nouveau processeur a géré les données et les tâches gourmandes en calcul avec une facilité qui semblait presque sans effort. Nos essais avec des applications de rendu et de calcul 3D, en particulier, ont montré les véritables prouesses de ces cœurs supplémentaires.
Nous avons noté une augmentation significative des vitesses de traitement par rapport au Genoa à 96 cœurs, avec et sans SMT activé, soulignant l'efficacité de la conception des puces d'AMD. Alors que nous plongeons plus profondément dans l'ère de l'informatique avancée à très haut nombre de cœurs, ce monstre à 128 cœurs et 256 threads établit une nouvelle référence en matière de densité de rack.
S'engager avec StorageReview
Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | Flux RSS