Entreprise

StorageReview établit un nouveau record pour le calcul de Pi : 314 billions de décimales sur un serveur Dell PowerEdge R7725

StorageReview a reconquis un titre de champion du calcul numérique avec un nouveau record de π à 314 billions de décimales. La course moderne au calcul de π est passée des expérimentations dans le cloud à une démonstration de puissance des infrastructures. En 2022, Google Cloud a poussé π à 100 billions de décimales, en exécutant y-cruncher sur une immense flotte d'instances cloud et en traitant des dizaines de pétaoctets d'E/S. Ce record a marqué un tournant, illustrant les limites du possible avec les infrastructures traditionnelles.

L'activité s'est ensuite déplacée en laboratoire. Début 2024, nous avons amélioré notre record à 105 billions de décimales sur un système reposant sur près d'un pétaoctet de SSD Solidigm QLC. Cette performance a établi une nouvelle référence en matière d'évolutivité et a démontré l'efficacité d'une seule machine sur site. Quelques mois plus tard, nous avons réitéré l'exploit, atteignant cette fois 202 billions de décimales. Ceci a confirmé que la mémoire flash haute densité et un paramétrage précis pouvaient surpasser les infrastructures hyperscale pour cette charge de travail spécifique et exigeante.

Bien sûr, les records attirent les challengers. Linus Media Group et KIOXIA ont décroché le titre avec une performance de 300 billions de chiffres, grâce à un important cluster de stockage partagé Weka doté de 2 Po de mémoire flash. Cet exploit a démontré le potentiel des infrastructures traditionnelles de stockage, malgré la complexité du matériel, la facture énergétique élevée et les contraintes liées au refroidissement. Impossible de rester les bras croisés et de laisser ce record intact !

StorageReview a désormais étendu le calcul de π à 314 billions de décimales. utilisant un seul 2U Dell PowerEdge R7725 Serveur équipé de deux processeurs AMD EPYC à 192 cœurs et de quarante 61.44SSD Micron Ion 6550 To. Le montage et l'optimisation du système ayant eu lieu en juillet, nous avons lancé notre test le 31 juillet 2025. Par un heureux hasard, notre test sur Raspberry Pi s'est terminé le deuxième jour de SC25, ce qui nous a permis d'établir un nouveau record HPC.

Mise à l'échelle du processeur y à 314 billions de chiffres

Une fois qu'on atteint les centaines de billions de décimales, y-cruncher se comporte moins comme un benchmark traditionnel et davantage comme un test de résistance d'infrastructure à long terme. L'application en elle-même est simple, mais son interaction avec le matériel à cette échelle devient déterminante. Tout repose sur la capacité du système à gérer des milliers d'opérations multi-précision sans saturer les processeurs ni la couche de stockage. C'est précisément au niveau du stockage que ce record a été établi. Nous avons déployé 40 SSD NVMe Micron 6550 Ion Gen5, dont 34 étaient dédiés à y-cruncher. Ce pool de SSD offrait environ 2.1 pétaoctets, fournissant à y-cruncher suffisamment d'espace pour effectuer le calcul des 314 téraoctets. Les 6 SSD restants ont servi à créer un volume RAID 10 logiciel, utilisé pour enregistrer les 314 téraoctets de décimales de pi.

Les modifications de conception entre les serveurs Dell PowerEdge de 16e et 17e génération ont également contribué à l'amélioration des performances de notre récent record de 314 To. Lors de notre précédent record de 202 To, nous avions utilisé le Dell PowerEdge R760 à 24 baies, doté d'un commutateur PCIe sur le fond de panier, privilégiant les performances à la densité de disques. Sur les serveurs Dell PowerEdge de 17e génération, tels que le R770 (Intel) ou le R7725 (AMD), les fonds de panier sont désormais configurés uniquement en connexion directe, avec 2 ou 4 lignes PCIe par baie. Sur le PowerEdge R7725, équipé d'un fond de panier Gen5 E3.S à 40 baies, chaque SSD bénéficie de 2 lignes PCIe. Bien que cela puisse sembler impacter les performances, la plateforme est toujours capable d'atteindre 280 Go/s en lecture et en écriture lorsque les 40 baies sont utilisées simultanément.

À l'aide de notre outil de test de stockage interne y-cruncher, nous avons enregistré les performances de stockage de chaque plateforme dans la configuration utilisée pour chaque exécution. Pour chaque charge de travail, nous avons constaté des gains de performances de stockage allant de 72 % à 383 %, avec des métriques de lecture et d'écriture équilibrées.

Métrique Système 202T (ancien record) Système 314T (nouveau record) Différence en pourcentage (314T vs 202T)
Écriture séquentielle 47.0 Gio/s 107 Gio/s + 127.7%
Lecture séquentielle 56.7 Gio/s 127 Gio/s + 124.0%
Seuil d'écriture 62.2 Gio/s 107 Gio/s + 72.0%
Lecture à seuil 20.9 Gio/s 101 Gio/s + 383.3%

Le Dell PowerEdge R7725 n'est pas qu'un simple serveur de stockage ; il offre également une puissance de calcul considérable grâce à sa plateforme biprocesseur AMD Turin. Nous avons utilisé deux processeurs AMD EPYC 9965 à 192 cœurs, pour un total de 384 cœurs. Nous avons également remplacé les dissipateurs thermiques d'origine par des plaques froides CoolIT SP5 à refroidissement liquide, elles-mêmes refroidies par une unité de distribution d'air liquide CoolIT AHx10. Cette configuration a permis de maintenir les processeurs à des fréquences d'horloge élevées et stables, les ventilateurs du châssis fonctionnant à environ 30 % de leur vitesse maximale (PWM), et la consommation électrique moyenne de notre système aux alentours de 1 600 W.

Côté logiciel, la plateforme a utilisé Ubuntu 24.04.2 LTS Server au lieu de Windows Server comme lors des essais précédents. Ce choix a permis d'optimiser la stabilité du système et d'obtenir des gains significatifs en termes de performances. Nous avons effectué de nombreux tests avant de lancer notre exécution, notamment en réservant 4 cœurs sur 384 pour les opérations système en arrière-plan. Le résultat ? Non seulement battre le record existant sur Raspberry Pi, mais le pulvériser sur de nombreux points. Notre exécution est inégalée en termes de performances, de consommation d'énergie et, surtout, de fiabilité. De plus, nous sommes les seuls à avoir établi un record du monde sur Raspberry Pi à grande échelle sans la moindre interruption. Du début à la fin, l'exécution s'est déroulée sans interruption.

Efficacité énergétique record

Pour chacun de nos tests de record de π, StorageReview a privilégié la réduction de la complexité et l'optimisation de la consommation énergétique. Le précédent record de 300 T, qui s'appuyait sur un cluster de stockage distribué et un réseau haut débit, avait engendré des besoins importants en énergie et en refroidissement. Nous avons opté pour une approche différente, en misant sur la densité de stockage et en utilisant un seul serveur 2U pour le stockage d'échange et de résultats. Ce choix a permis de réduire considérablement notre consommation énergétique et nos besoins en refroidissement. Notre serveur Dell PowerEdge R7725 a consommé seulement 4 304,662 kWh lors du test de 314 T, soit seulement 13.70 kWh par billion de décimales. Il s'agit ainsi de l'un des calculs de π à grande échelle les plus économes en énergie. La différence entre les deux approches est flagrante, comme le montre le tableau ci-dessous.

Courir kWh total Coût à 0.12 $/kWh Coût à 0.20 $/kWh
300T Weka Cluster Run 33,600 XNUMX kWh (est.) $4,032 $6,720
314T Exécution sur un seul serveur 4,304.662 kWh $517 $861

Il est important de noter que lors du calcul, notre test de 314 To a utilisé des SSD en configuration JBOD sans résilience des données. La consommation d'énergie et les performances globales du système ont motivé ce choix, mais ont également suscité une réflexion sur la conception d'une solution de stockage adaptée à la charge de travail. Chaque charge de travail est différente, et certaines, pouvant être redémarrées avec un impact minimal sur la production, ne nécessitent pas forcément le même niveau de tolérance aux pannes. Dans notre cas, nous avons privilégié la protection des données de sortie grâce à un RAID logiciel traditionnel.

Durée totale d'exécution : 110 jours

Malgré un nombre de chiffres calculés supérieur à celui de toutes les exécutions précédentes, le temps d'exécution réel a été nettement inférieur au record précédent, qui nécessitait environ 225 jours (175 jours de calcul hors interruptions). Cette durée ininterrompue de 110 jours s'explique par un système d'exploitation stable, une charge de calcul en arrière-plan minimale, une topologie NUMA équilibrée et une matrice de calcul temporaire conçue pour le modèle généré par le processeur de calcul à cette échelle.

Points forts techniques

  • Total des chiffres calculés: 314,000,000,000,000
  • Matériel utiliséServeur Dell PowerEdge R7725 avec 2 processeurs AMD EPYC 9965, 1.5 To de mémoire vive DDR5 et 40 disques durs Micron 6550 Ion de 61.44 To chacun.
  • Logiciels et algorithmes: y-cruncher v0.8.6.9545, Chudnovsky
  • Usure du SSD par SMART7.3 Po écrits par disque, soit 249.11 Po répartis sur les 34 SSD utilisés pour l'échange.
  • Le plus grand point de contrôle logique: 850 538 385 064 992 (774 Tio)
  • Utilisation logique du disque de pointe: 126 658 805 195 776 600 (1.43 PiB)
  • Octets de disque logique lus: 126 658 805 195 776 600 (132 PiB)
  • Octets de disque logique écrits: 126 658 805 195 776 600 (112 PiB)
  • Date de début : : Jeu 31 juil 17:16:41 2025
  • Date de fin: mar. 18 nov. 05:57:08 2025
  • pi: 8 793 223,144 secondes, 101.773 jours
  • Temps de calcul total: 9274878.580 seconde
  • Temps de mur du début à la fin: 9463226.454 seconde

Réflexions de clôture

Pendant des décennies, les tentatives de calcul extrême de pi ont permis de mettre en valeur les machines considérées comme « puissantes » à l'époque. Les premiers records reposaient sur des ordinateurs de bureau hautes performances et du stockage externe, puis sur des équipements d'entreprise locaux. Plus récemment, la course s'est déplacée vers le cloud, où des exploits comme la tentative de Google d'atteindre 100 000 milliards de décimales ont prouvé qu'il était possible d'établir un record par la force brute, avec suffisamment d'instances et d'entrées/sorties. Puis sont apparus les grands clusters de stockage partagé, sacrifiant la simplicité au profit d'un parallélisme brut et d'une consommation énergétique et de refroidissement colossale.

Notre approche a été radicalement différente. Lors de plusieurs tentatives de test record, nous avons considéré y-cruncher comme une charge de travail HPC sérieuse, et non comme un simple exercice ponctuel. Les solutions à 105T et 202T nous ont permis d'identifier les véritables goulots d'étranglement, de dimensionner et d'optimiser le stockage temporaire, d'alimenter les processeurs sans surcharger la couche d'E/S et de renforcer la robustesse du système afin qu'une tâche de plusieurs mois puisse s'achever. La tentative à 314T est le fruit de cette expérience. Il ne s'agit pas simplement d'un chiffre plus élevé, mais d'une conception plus aboutie.

Les indicateurs confirment ces résultats. Nous avons dépassé les 300 billions de chiffres sur un seul serveur Dell PowerEdge R7725 2U équipé de 40 SSD Micron 6550 Ion et de deux processeurs AMD EPYC à 192 cœurs. Le système est resté opérationnel pendant 110 jours consécutifs, sans aucune interruption. Le débit de stockage a plus que doublé par rapport à notre plateforme 202T, tandis que le serveur a consommé en moyenne 1 600 W et 4 305 kWh au total. Cela représente 13.70 kWh par billion de chiffres, soit une fraction de l'énergie consommée par notre précédent cluster 300T : moins de nœuds, moins de complexité, moins d'énergie, et une productivité accrue.

C’est pourquoi ce record dépasse le simple cadre de la simple performance : si un serveur 2U commercial peut supporter une exécution de calcul intensif de cette ampleur, avec un tel niveau de fiabilité et d’efficacité, les mêmes principes de conception sont directement applicables à la recherche scientifique de production. Les modèles climatiques de longue durée, les simulations physiques, les pipelines de génomique et les tâches d’entraînement d’IA reposent tous sur les mêmes fondamentaux : des E/S équilibrées, une gestion thermique prévisible, un firmware stable et une architecture capable de fonctionner en continu pendant des mois. Cette plateforme a désormais prouvé qu’elle pouvait le faire précisément dans des conditions ne tolérant aucune erreur.

Oui, StorageReview a reconquis le titre de champion du calcul en nombres entiers (π) avec 314 billions de décimales. Plus important encore, nous avons établi la nouvelle norme en matière de calcul numérique à grande échelle sur du matériel réel. Si quelqu'un souhaite battre ce record, nous aimerions qu'il atteigne le niveau maximal : plus de décimales, moins de consommation d'énergie, un temps d'exécution plus court et la même fiabilité sans interruption de service. En attendant, il s'agit de la référence en matière d'efficacité.

Kevin O'Brien

À l'intérieur du laboratoire StorageReview, évaluant les produits et travaillant avec les leaders de l'industrie pour développer de nouveaux environnements de test. À la maison, j'élève une famille.

Derniers Articles

HPE Alletra Storage MP B10000 et NIST CSF 2.0 : une architecture de cyber-résilience complète

HPE a conçu une architecture de cyber-résilience coordonnée autour du système de stockage Alletra MP B10000. Elle étend la sécurité native de la plateforme…

Il y a 6 jours

Des bases de données et charges de travail virtualisées à la sauvegarde : Dell PowerEdge R4715 et R5715 pour les réalités des PME

Bien que les serveurs Dell PowerEdge R4715 et R5715 soient deux produits distincts, ils doivent être considérés comme une matrice configurable. Cette matrice…

il y a 2 semaines

Test du SSD Micron 6600 ION 245 To : Un quart de pétaoctet par baie de disque

Le SSD NVMe 6600 ION de Micron atteint désormais 245.76 To, propulsant ainsi la gamme PCIe Gen5 QLC de l'entreprise, axée sur la capacité, dans la catégorie des quarts de pétaoctets. Micron…

il y a 2 semaines

Test de la carte graphique AMD Radeon RX 9070 GRE : 12 Go RDNA 4 pour le jeu en 1440p

La Radeon RX 9070 GRE n'est pas une nouvelle carte graphique. AMD l'a lancée l'année dernière exclusivement en Chine, et…

il y a 2 semaines

Dell PowerStore Gen 3 : Au cœur de la réinitialisation de stockage d’entreprise la plus agressive depuis des années

Les mises à jour de stockage se présentent généralement sous deux formes. Il y a la mise à niveau discrète, où un fournisseur intègre un nouveau processeur, affirme…

il y a 4 semaines

Dell PowerProtect One : Cyber-résilience ouverte, intégrée et intelligente

L'infrastructure de sauvegarde et de restauration a toujours été la partie du centre de données qui retient le plus l'attention lorsqu'un problème survient…

il y a 4 semaines