StorageReview.com

De l'entreprise au SFF : NVIDIA lance les GPU RTX PRO 6000, 4000 SFF et 2000 Blackwell

AI  ◇  Entreprise

NVIDIA élargit sa gamme de GPU professionnels avec de nouveaux matériels destinés aux centres de données à grande échelle et aux stations de travail compactes. Lors du SIGGRAPH 2025, l'entreprise a dévoilé la RTX PRO 6000 Blackwell Server Edition pour serveurs d'entreprise, ainsi que deux nouveaux GPU de bureau : la RTX PRO 4000 Small Form Factor (SFF) Edition et la RTX PRO 2000 Blackwell. Ces annonces soulignent la volonté d'offrir les performances de l'architecture Blackwell à un large éventail de charges de travail professionnelles, de l'entraînement de modèles d'IA et de la simulation industrielle à la conception technique et à la production multimédia. Outre le matériel, NVIDIA et ses partenaires mettent l'accent sur les plateformes logicielles d'IA intégrées qui permettent à ces GPU d'accélérer toutes les applications, de l'IA générative à la robotique et aux applications d'IA physique.

Serveur NVIDIA 2U RTX PRO

NVIDIA RTX PRO 6000 Blackwell Server Edition : une nouvelle puissance pour le centre de données

NVIDIA a confirmé que son GPU RTX PRO 6000 Blackwell Server Edition sera bientôt disponible sur une large gamme de serveurs d'entreprise grand public, intégrant ainsi sa dernière architecture GPU au format rack 2U (l'un des formats de serveur les plus répandus). Ces nouvelles configurations visent à aider les entreprises à passer des configurations traditionnelles de centres de données exclusivement CPU à des plateformes accélérées par GPU.

La RTX PRO 6000 repose sur l'architecture Blackwell de NVIDIA et embarque 24,064 752 cœurs de traitement parallèle CUDA, lui permettant de gérer une grande variété de charges de travail exigeantes. Elle intègre 5 cœurs NVIDIA Tensor de 188e génération pour accélérer l'entraînement et l'inférence de l'IA, ainsi que 117 cœurs RT de 32e génération pour le ray tracing en temps réel. Côté spécifications, elle offre 3.7 téraflops en simple précision (FP4), 354.5 pétaflops en IA FPXNUMX et XNUMX téraflops pour ses cœurs RT. Grâce à cette combinaison, la carte est parfaitement équipée pour s'attaquer aux tâches nécessitant à la fois des calculs intensifs et un rendu haut de gamme.

Puce NVIDIA RTX PRO 6000 Blackwell Server Edition

La capacité mémoire s'élève à 96 Go de GDDR7 avec ECC pour améliorer l'intégrité des données pendant le traitement. Avec une interface mémoire 512 bits et une bande passante de 1,597 24 Go/s, le GPU est capable de déplacer de grands ensembles de données, un atout majeur pour la simulation, l'entraînement des modèles d'IA et la visualisation haute résolution. La conception prend en charge le vGPU et jusqu'à quatre partitions GPU multi-instances (MIG), chacune dotée de XNUMX Go de mémoire dédiée, permettant l'exécution simultanée de charges de travail isolées sur la même carte physique. Les tâches de traitement vidéo et image sont accélérées grâce à quatre encodeurs NVENC, quatre décodeurs NVDEC et quatre moteurs JPEG.

Les fonctionnalités de sécurité et de fiabilité incluent la prise en charge de l'informatique confidentielle, le démarrage sécurisé avec racine de confiance et une interface PCI Express 5.0 x16 pour une connectivité haut débit. La carte dispose de quatre connecteurs DisplayPort 2.1, mesure 4.4 cm de haut et 10.5 cm de long et s'intègre dans une configuration à deux emplacements. Le refroidissement est passif et l'alimentation est assurée par un seul connecteur PCIe CEM5 16 broches, avec une consommation configurable jusqu'à 600 watts.

Les systèmes Cisco, Dell Technologies, HPE, Lenovo et Supermicro seront parmi les premiers à être livrés avec les nouveaux serveurs RTX PRO 2U, chacun prenant en charge différentes configurations de GPU RTX PRO 6000 Blackwell. Cette architecture est conçue pour accélérer un large éventail de charges de travail, notamment l'apprentissage et l'inférence de modèles d'IA, l'analyse de données, les simulations scientifiques, le rendu photoréaliste, la robotique industrielle et d'autres formes de développement d'IA physique.

NVIDIA RTX PRO 6000 Blackwell Server Edition
Architecture GPU Architecture NVIDIA Blackwell
Cœurs de traitement parallèle CUDA 24,064
Noyaux Tensor NVIDIA 752 (5e génération)
Cœurs NVIDIA RT 188 (4e génération)
Performances en simple précision (FP32) 117 TFLOPS
Pic de PFLOPS IA FP4 3.7hXNUMX FPLOPS
Performances de base RT 354.5 TFLOPS
Mémoire GPU GDDR96 7 Go avec ECC
Interface de mémoire 512-bits
Bande passante mémoire 1597 GB / s
Consommation d'énergie Jusqu'à 600 W (configurable)
GPU multi-instances Jusqu'à 4 MIG à 24 Go
NVENC | NVDEC | JPEG 4x | 4x | 4x
Calcul confidentiel Appareils
Démarrage sécurisé avec racine de confiance Oui
Bus graphique PCI Express 5.0 x16
Connecteurs d'affichage 4x DisplayPort 2.1
Facteur de forme 4.4″ (H) x 10.5″ (L), double fente
Solution thermique Revenu
Câble d'alimentation 1x PCIe CEM5 16 broches

Les gains de performances par rapport au GPU NVIDIA L40S de génération précédente devraient être significatifs. Les nouveaux cœurs Tensor de 5e génération et le moteur Transformer de 2e génération, compatibles avec la précision FP4, offrent des vitesses d'inférence jusqu'à six fois supérieures. La technologie graphique RTX de XNUMXe génération multiplie par quatre le débit de rendu et de visualisation.

Outre des performances accrues, ces nouveaux systèmes RTX PRO 6000 ont été conçus pour être plus efficaces. NVIDIA constate une efficacité énergétique jusqu'à 18 fois supérieure à celle des serveurs 2U exclusivement équipés de processeurs, ce qui est particulièrement pertinent pour les installations soumises à des contraintes d'espace et de puissance. Cet équilibre entre vitesse et efficacité est crucial pour les charges de travail telles que la simulation à grande échelle, la génération de données synthétiques et la formation en robotique, où le délai d'obtention des résultats est crucial.

HPE intégrera le GPU à sa gamme ProLiant Compute, notamment le DL385 Gen11, compatible avec deux GPU RTX PRO 6000 au nouveau format RTX PRO 2U, et le DL380a Gen12, compatible avec jusqu'à huit GPU au format 4U. Ces systèmes fonctionneront avec la plateforme d'IA Private Cloud de HPE, qui prend en charge les derniers modèles d'IA de NVIDIA, notamment Nemotron pour l'IA agentique, Cosmos Reason pour la robotique, ainsi que des outils de recherche et de synthèse vidéo mis à jour.

Les expéditions de ces modèles de serveurs commencent le 2 septembre.

GPU NVIDIA RTX PRO 4000 SFF et RTX PRO 2000 Blackwell : accélération pour station de travail compacte

Parallèlement au lancement axé sur les serveurs, NVIDIA élargit sa gamme de GPU de bureau avec deux nouveaux modèles basés sur Blackwell destinés aux stations de travail professionnelles : la RTX PRO 4000 SFF Edition et la RTX PRO 2000. Toutes deux sont conçues pour apporter les avantages de l'IA et de l'accélération graphique de nouvelle génération aux stations de travail compactes et économes en énergie dans des secteurs tels que l'ingénierie, la production multimédia et l'architecture.

La RTX PRO 4000 SFF Edition occupe la moitié de la taille d'un GPU standard, tout en conservant les cœurs RT de 4e génération et les cœurs Tensor de 2.5e génération. Par rapport à son prédécesseur, elle offre des performances d'IA jusqu'à 1.7 fois supérieures, un ray tracing 1.5 fois supérieur et une bande passante mémoire 70 fois supérieure, le tout avec une puissance de XNUMX W.

La RTX PRO 2000 cible les tâches courantes de conception et d'IA. NVIDIA revendique une modélisation 1.6D jusqu'à 3 fois plus rapide, des performances CAO 1.4 fois plus rapides et des vitesses de rendu 1.6 fois plus rapides que la génération précédente. Elle apporte également des améliorations notables dans les charges de travail d'IA générative, avec une vitesse de création d'images multipliée par 1.4 et une génération de texte 2.3 fois plus rapide, permettant un prototypage et des itérations plus rapides.

NVIDIA indique que des tests en conditions réelles menés par des organisations telles que le Mile High Flood District, le Bureau géospatial du gouvernement de Cantabrie et des studios de design comme Studio Tim Fu démontrent l'utilité de la carte pour gérer de grands ensembles de données, des charges de travail géospatiales et des workflows de conception pilotés par l'IA. Les tests de performance du cabinet d'ingénierie Thornton Tomasetti ont montré que la RTX PRO 2000 exécutait des analyses structurelles près de trois fois plus vite que la génération précédente et plus de 27 fois plus vite que les méthodes basées sur le processeur.

La disponibilité des deux modèles est prévue plus tard cette année par l'intermédiaire des principaux OEM et partenaires de distribution.

SIGGRAPH Focus : Les postes de travail à l'ère de l'IA physique

Au SIGGRAPH, NVIDIA a souligné le rôle de sa gamme de stations de travail RTX PRO (dont les nouvelles RTX PRO 4000 SFF et RTX PRO 2000) dans l'optimisation des workflows professionnels d'IA et de simulation. Au-delà du matériel, NVIDIA positionne son écosystème logiciel comme un moteur essentiel d'adoption.

La suite NVIDIA AI Enterprise propose des outils pour développer et déployer l'IA sur l'ensemble de l'infrastructure, tandis que la plateforme Cosmos propose des modèles de base optimisés pour la robotique, l'automatisation et l'IA de pointe. La plateforme Omniverse reste essentielle pour la simulation 3D, la conception collaborative et les workflows de jumeaux numériques, s'intégrant directement aux capacités d'IA du matériel.

Cette combinaison de GPU compacts et performants et d'une pile logicielle d'IA performante illustre l'ampleur de l'évolution du secteur. Le calcul accéléré par l'IA n'est plus réservé aux centres de données géants. Des stations de travail plus petites peuvent désormais gérer les mêmes types de tâches, de la création de contenu IA générative à la simulation robotique, qui nécessitaient auparavant des systèmes beaucoup plus volumineux et gourmands en énergie.

Dell étend sa plateforme de données IA avec NVIDIA et Elastic

Des mises à jour de la plateforme Dell AI Data Platform, créée avec NVIDIA et Elastic, ont également été annoncées pour gérer l'intégralité du flux de travail d'IA, de l'ingestion des données à l'inférence. Un nouveau moteur de données non structurées (optimisé par la recherche vectorielle d'Elastic) ajoute la récupération sémantique et la recherche hybride par mots-clés pour un accès plus rapide et plus précis aux grands ensembles de données non structurées. Il utilise l'accélération GPU et fonctionne en complément des outils existants, tels qu'un moteur SQL fédéré, le traitement de données à grande échelle et un stockage haute vitesse compatible avec l'IA.

La plateforme s'intègre désormais à la conception de référence NVIDIA AI Data Platform, offrant une architecture validée combinant stockage, calcul, réseau et logiciels d'IA. Le premier matériel à intégrer cette configuration sera le Dell PowerEdge R7725, un serveur 2U doté de la technologie GPU NVIDIA RTX PRO 6000 Blackwell Server Edition mentionnés ci-dessus. Ces systèmes ciblent des charges de travail telles que l'inférence de modèles de langage à grande échelle, la simulation d'ingénierie et le raisonnement par IA avec des modèles comme NVIDIA NeMo et Cosmos.

Dell indique que la RTX PRO 6000 offre un débit de jetons LLM jusqu'à six fois supérieur, des performances de simulation d'ingénierie deux fois supérieures et prend en charge quatre fois plus d'utilisateurs MIG simultanés que la génération précédente. L'association de la R7725 à la plateforme mise à jour offre une solution clé en main pour une inférence plus rapide, une recherche sémantique réactive et la possibilité de gérer des charges de travail d'IA plus importantes sans conception système personnalisée.

Au SIGGRAPH 2025, Dell présente ces capacités aux côtés de sa gamme de PC Dell Pro Max, qui ajoutera bientôt le Pro Max compact avec la station de travail pour développeurs GB10 AI.

HPE intègre la carte graphique RTX PRO 6000 Blackwell aux serveurs ProLiant

Enfin, de nouveaux ajouts au portefeuille NVIDIA AI Computing by HPE de HPE apportent également la GPU RTX PRO 6000 Blackwell Server Edition à ses serveurs ProLiant Compute au format 2U. Deux configurations seront disponibles. Le ProLiant DL385 Gen11 peut accueillir jusqu'à deux GPU RTX PRO 6000 dans le nouveau format 2U RTX PRO Server, tandis que le ProLiant DL380a Gen12 prend en charge jusqu'à huit GPU dans un format 4U. Les livraisons débuteront le 2 septembre 2025.

Ces serveurs sont conçus pour une large gamme de charges de travail, de l'IA générative et agentique à la robotique, en passant par les applications industrielles, la simulation et l'informatique visuelle. Les modèles Gen12 ProLiant intègrent des fonctionnalités de sécurité multicouches telles que HPE Integrated Lights Out (iLO) 7 avec Silicon Root of Trust, une enclave sécurisée et une signature de micrologiciel résistante aux attaques quantiques. HPE Compute Ops Management intègre une automatisation centralisée du déploiement et de la maintenance, réduisant ainsi le temps de gestion des serveurs et les temps d'arrêt.

HPE a également présenté en avant-première la nouvelle génération de sa plateforme d'IA pour cloud privé, co-développée avec NVIDIA. Cette mise à jour prendra en charge les GPU RTX PRO 6000, offrira une évolutivité fluide entre les générations de GPU et inclura des fonctionnalités telles que la gestion en air gap et la mutualisation d'entreprise. La plateforme sera également compatible avec les derniers modèles de raisonnement Nemotron de NVIDIA pour l'IA agentique, le modèle de langage de vision Cosmos Reason pour la robotique et l'IA physique, et le Blueprint pour la recherche et la synthèse vidéo (VSS 2.4) mis à jour. Ces ajouts visent à aider les entreprises à déployer rapidement des agents d'IA capables de traiter et d'analyser de grands volumes de données vidéo et visuelles.

NVIDIA RTX PRO 6000 Blackwell Server Edition

S'engager avec StorageReview

Bulletin d'information (en anglais) |  YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | Flux RSS

Lyle Smith

Lyle est un rédacteur de longue date pour StorageReview, couvrant un large éventail de sujets liés aux utilisateurs finaux et à l'informatique d'entreprise.