Accueil EntrepriseAI CoreWeave dévoile le premier système Dell XE9712 GB200 NVL-72

CoreWeave dévoile le premier système Dell XE9712 GB200 NVL-72

by Divyansh Jain

CoreWeave a dévoilé son premier système Dell XE9712 GB200 NVL-72, accompagné d'informations sur les performances !

CoreWeave a déployé le dernier système GB200 NVL-72 avec les nouveaux serveurs Dell XE9712. Le système a été présenté lors d'une démonstration en direct dans un centre de données de pointe de Switch, qui a mis en évidence ses performances révolutionnaires et son infrastructure de refroidissement avancée.

Carte mère Dell XE9712 GB200 NVL-72

Le système GB200 NVL-72 de CoreWeave, hébergé dans la chambre Evo de Rob Roy, est conçu pour gérer les charges de travail informatiques les plus exigeantes. La démonstration en direct a commencé avec le test NCCL All-Reduce, un test de référence démontrant la bande passante ultra-élevée et la faible latence de l'interconnectivité Nvidia NVLink sur les 72 GPU du rack. Le test garantit une communication transparente entre les GPU.

BSur cette base, le test GPU Blaze a illustré la puissance de calcul brute du système. Les GPU ont traité des charges de travail complexes de multiplication de matrices, simulant des opérations utilisées dans la formation de l'IA, les simulations scientifiques et le traitement avancé des données.

Formation en direct avec Sunk de CoreWeave

Le GB200 NVL-72 a également été testé avec une formation en direct utilisant Slurm sur Kubernetes (Sunk), entraînant le modèle Megatron. La session de formation a validé le rack avec une charge de travail réelle et a démontré la charge résultante sur l'infrastructure de refroidissement et d'alimentation.

À mesure que l'activité du GPU augmentait, l'unité de distribution de refroidissement (CDU) intégrée au rack ajustait de manière dynamique la sortie de refroidissement pour maintenir des températures matérielles optimales. Les données en temps réel de la CDU ont illustré la manière dont les températures de retour du fluide augmentaient avec les charges de travail du GPU, garantissant une gestion thermique efficace sans compromettre les performances.

Le tableau de bord d'alimentation du GB200 NVL-72 a fourni un aperçu continu des besoins énergétiques du système, démontrant son efficacité et sa transparence dans la gestion de l'énergie.

La chambre évolutive de Rob Roy

Le NVL72 est hébergé dans la chambre Evo de Rob Roy, qui offre une capacité impressionnante de 1 MW de puissance et de refroidissement par rack. Cette avancée en matière d'infrastructure combine 250 kW de refroidissement par air avec 750 kW de capacité de refroidissement liquide direct sur puce, garantissant des performances optimales pour les charges de travail d'IA et de HPC les plus exigeantes. La conception sophistiquée de la chambre maintient une utilisation efficace de l'énergie et une gestion thermique tout en prenant en charge les exigences informatiques de nouvelle génération.

Conclusion

CoreWeave est un leader incontesté du secteur en matière d’infrastructure d’IA en tant que service. Son succès est en grande partie dû à sa capacité à intégrer les dernières infrastructures d’IA plus rapidement que les autres clouds. Les nouveaux systèmes Dell GB200 NVL-72 représentent une nouvelle ère dans le calcul haute performance. Ils combinent des performances GPU de pointe, des solutions de refroidissement avancées et une efficacité énergétique pour répondre aux exigences de l’IA, de la recherche scientifique et des applications gourmandes en données, ce qui constitue une victoire majeure pour ses clients qui exécutent des charges de travail d’IA à grande échelle. 

CoreWeave

S'engager avec StorageReview

Newsletter |  YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | Flux RSS