Poste de travail

Test du GPU NVIDIA RTX PRO 6000 Workstation : architecture Blackwell et 96 Go pour les workflows professionnels

En août, NVIDIA a divisé son offre haut de gamme Blackwell pour PC de bureau en deux catégories destinées aux professionnels : Station de travail et Serveur. La carte RTX PRO 6000 pour station de travail est conçue pour les créateurs, les ingénieurs et les développeurs en IA qui ont besoin d'un maximum de puissance de calcul et de VRAM dans un châssis tour ou pour PC de bureau. La RTX PRO 6000 Blackwell Server Edition est conçue pour les serveurs rack et les nœuds d'inférence ou de rendu sans tête dans les centres de données. Maintenant que nous avons la carte pour station de travail sur le banc d'essai, nous pouvons nous concentrer sur ce point pour ce test.

À 8 500 $, la RTX PRO 6000 embarque un processeur GB202 complet avec 24 064 cœurs CUDA, 752 cœurs Tensor de cinquième génération, 188 cœurs RT de quatrième génération et 96 Go de GDDR7 ECC. Son attrait est immédiat. Elle offre une capacité mémoire inégalée par les cartes grand public, des pilotes professionnels et un format à double emplacement adapté aux stations de travail réelles, sans exigences particulières en termes d'alimentation ni de ventilation.

NVIDIA positionne ce GPU pour des workflows mixtes. Cela inclut l'inférence LLM locale avec contexte long, le rendu de scènes volumineuses, la simulation complexe et les plateformes de recherche multi-GPU. L'aspect pratique est ici primordial. La carte utilise une interface PCIe 5.0 x16 standard, offre quatre sorties DisplayPort 2.1b pour une visualisation haute résolution et à taux de rafraîchissement élevé, et offre un TDP configurable de 600 W, permettant aux intégrateurs d'optimiser les performances thermiques, acoustiques ou la densité.

Notre objectif est d’évaluer les performances de cette version de poste de travail en laboratoire en termes d’IA, de rendu et de calcul général, et de quantifier l’impact du pool de 96 Go sur les capacités d’un seul nœud de bureau.

NVIDIA RTX PRO 6000 Workstation vs. Server Edition

Les variantes de la RTX PRO 6000 reposent sur la même base Blackwell GB202 ; les capacités de calcul brutes semblent donc familières sur le papier. La différence réside dans leur emplacement et leur mode d'installation. La carte pour station de travail que nous testons est une carte autonome, refroidie activement, à double emplacement, dotée de quatre sorties DisplayPort 2.1b et de pilotes de qualité studio. Elle s'intègre dans une tour ou un poste de travail de bureau, pilote des écrans locaux et exécute des applications DCC et CAO certifiées ISV, ainsi que CUDA, TensorRT et cuDNN. Si les workflows combinent visualisation interactive, visualisation locale et IA intégrée, cette solution permet de tout regrouper dans un seul châssis avec une acoustique et des performances thermiques prévisibles.

RTX PRO 6000 Blackwell Server Edition est conçu pour un usage totalement différent. Il s'agit d'une configuration sans écran, axée sur le rack, destinée aux serveurs, avec une ventilation de l'avant vers l'arrière et des fonctionnalités de gestion à distance. Il n'y a pas de sorties d'affichage actives, car les tâches sont planifiées sur le réseau et les résultats sont consultés à distance. Le micrologiciel, la consommation d'énergie et les profils thermiques sont optimisés pour une utilisation 24h/24 et 7j/7 via un planificateur, généralement associé à NVIDIA AI Enterprise, à l'orchestration de conteneurs et au transfert d'hyperviseur. En résumé, le modèle station de travail est le choix idéal lorsque les créateurs et les ingénieurs doivent visualiser et manipuler le travail localement tout en exécutant de grands lots d'inférences ou de simulations. L'édition serveur est plus judicieuse pour la mise à l'échelle de nœuds identiques derrière une file d'attente dans un centre de données, où chaque watt, câble et flux d'air doit s'adapter à un plan de service OEM.

Spécifications de la carte graphique NVIDIA RTX PRO 6000

Le tableau ci-dessous présente les spécifications de la NVIDIA RTX PRO 6000 par rapport à la RTX 5090 et à la génération précédente d'Ada Lovelace RTX 4090.

Comparaison GPU NVIDIA RTX PRO 6000 NVIDIA RTX 5090 NVIDIA RTX 4090
Nom du GPU GB202 GB202 AD102
Architecture Puits noir 2.0 Puits noir 2.0 Ada Lovelace
Taille du processus 5 nm 5 nm 5 nm
Transistors 92,200 millions 92,200 millions 76,300 millions
Densité 122.9 M/mm² 122.9 M/mm² 125.3 M/mm²
Taille de la matrice 750 mm² 750 mm² 609 mm²
Largeur de fente Double fente Double fente Triple fente
Dimensions 304 mm x 137 mm x 40 mm 304 mm x 137 mm x 48 mm 304 mm x 137 mm x 61 mm
TDP 600W 575W 450W
Sortie 4x DisplayPort 2.1b 1x HDMI 2.1b, 3x DisplayPort 2.1b 1x HDMI 2.1, 3x DisplayPort 1.4a
Connecteurs d'alimentation 1x 16-pin 1x 16-pin 1x 16-pin
Interface de bus PCIe 5.0 x16 PCIe 5.0 x16 PCIe 4.0 x16
Horloge de base 1590 MHz 2017 MHz 2235 MHz
Boost Horloge 2617 MHz 2407 MHz 2520 MHz
Horloge mémoire 1750 MHz (efficace 28 Gbps) 2209 MHz (efficace 28 Gbps) 1313 MHz (efficace 21 Gbps)
Taille de la mémoire 96 GB 32 GB 24 GB
Type de mémoire GDDR7 ECC GDDR7 GDDR6X
Bus mémoire 512 Bits 512 Bits 384 Bits
Bande passante mémoire 1.79 TB / s 1.79 TB / s 1.01 TB / s
Cœurs de CUDA 24,064 21,760 16,384
Noyaux de tenseurs 752 680 512
ROPs 192 192 176
Nombre SM 188 170 128
RT Cœurs 188 170 128
L1 Cache 128 Ko (par SM) 128 Ko (par SM) 128 Ko (par SM)
L2 Cache 128 MB 88 MB 72 MB
Taux de pixels 502.5 GPixel/s 462.1 GPixel/s 443.5 GPixel/s
Taux de texture 1,968.0 GTexel/s 1,637 GTexel/s 1,290 GTexel/s
FP16 (demi) 126.0 TFLOPS (1:1) 104.8 TFLOPS (1:1) 82.58 TFLOPS (1:1)
FP32 (flotteur) 126.0 TFLOPS 104.8 TFLOPS 82.58 TFLOPS
FP64 (double) 1.968 TFLOPS (1:64) 1.637 TFLOPS (1:64) 1,290 1 GFLOPS (64:XNUMX)
Prix ​​de lancement (USD) $8,500 $1,999 $1,599

Construire et concevoir

Le GPU RTX PRO 6000 Workstation reprend le design épuré et fonctionnel de NVIDIA, tel qu'il a été présenté sur la RTX 5090 FE, avec une finition noire mate industrielle et une configuration à double ventilateur axial optimisée pour les environnements de travail. Chaque ventilateur est conçu pour propulser l'air à travers la chambre à vapeur 3D sur toute la longueur, contribuant ainsi à maintenir l'équilibre thermique sous des charges de travail soutenues. Mesurant 304 mm × 137 mm × 40 mm, il s'intègre parfaitement dans une configuration à double emplacement et offre une densité de performances exceptionnelle compte tenu de son enveloppe thermique de 600 W.

Sur le bord supérieur, le PRO 6000 est doté d'un connecteur d'alimentation unique à 16 broches, fournissant le courant nécessaire à ses 96 Go de mémoire GDDR7 et à son architecture Blackwell 2.0. Sa fabrication est haut de gamme et rigide, avec un carénage en aluminium qui canalise efficacement l'air à travers les ailettes. Le logo NVIDIA discret complète son esthétique professionnelle, sans RVB ni fioritures gaming, mettant l'accent sur la fiabilité et les performances dans un châssis de station de travail exigeant en termes de température.

Côté E/S, NVIDIA propose quatre sorties DisplayPort 2.1b, garantissant la compatibilité avec les configurations multi-écrans 8K, les workflows HDR aux couleurs précises et les environnements de rendu avancés. L'utilisation du DisplayPort 2.1b sur HDMI reflète son orientation professionnelle, avec une bande passante améliorée pour les écrans haute résolution et à taux de rafraîchissement élevé.

Test de performance

Pour évaluer les performances de notre échantillon de carte graphique NVIDIA RTX PRO 6000, nous l'avons comparée directement à ses homologues grand public phares, les RTX 5090 Founders Edition et RTX 4090 Founders Edition. Les tests ont été menés sur un mélange de charges de travail professionnelles et pilotées par l'IA afin de mettre en évidence la puissance de calcul brute et les performances applicatives réelles. Les benchmarks incluaient UL Procyon AI Text Generation, UL Procyon AI Image Generation, LuxMark, Geekbench 6 et V-Ray, offrant un aperçu équilibré des performances de rendu, d'inférence et de productivité.

En plus de ces charges de travail standard, nous avons également effectué des tests ciblés conçus pour mettre en valeur les 96 Go de mémoire GDDR7 de la RTX PRO 6000, démontrant ses avantages dans la gestion de grands modèles, d'ensembles de données haute résolution et de charges de travail de visualisation professionnelles où la capacité et le débit soutenu sont essentiels.

Pour exploiter pleinement les avantages de la nouvelle carte graphique NVIDIA RTX PRO 6000, nous avons utilisé notre plateforme AMD ThreadRipper. Ce système, tel que configuré, intègre un processeur 64 cœurs et un circuit de refroidissement liquide. Il dispose d'une puissance CPU suffisante pour permettre au GPU de travailler sans entrave. La configuration complète du système est présentée ci-dessous.

Plateforme de test AMD ThreadRipper StorageReview
  • Carte mère: ASUS Pro WS TRX50-SAGE WIFI
  • CPU: AMD Ryzen Threadripper 7980X 64 cœurs
  • RAM: 32 Go DDR5 4800MT/s
  • Stockage: Samsung 2 Pro 980 To
  • OS: Windows 11 Pro pour les stations de travail

UL Procyon : Génération de texte par IA

Texte de l'IA de Procyon Generation référence Simplifie les tests de performance des LLM d'IA en proposant une méthode d'évaluation concise et cohérente. Elle permet des tests répétés sur plusieurs modèles LLM tout en minimisant la complexité des modèles volumineux et des facteurs variables. Développée avec des leaders du matériel d'IA, elle optimise l'utilisation d'accélérateurs d'IA locaux pour des évaluations de performance plus fiables et plus efficaces. Les résultats mesurés ci-dessous ont été testés avec TensorRT.

Lors des quatre tests, la NVIDIA RTX PRO 6000 a constamment dominé le peloton. En commençant par Phi, la PRO 6000 a obtenu un score global de 6 775, surpassant la RTX 5090 (5 749), la RTX 4090 (4 958) et la RTX 6000 Ada (4 508). Sa vitesse de génération de jetons plus rapide (325.9 jetons/s) et sa latence plus faible (0.182 s au premier jeton) soulignent sa réactivité dans la génération de texte en temps réel et les applications d'IA basées sur le chat.

La tendance s'est poursuivie avec le Mistral, où le PRO 6000 a enregistré 7 346, conservant une marge substantielle sur les 5090 (6 267), 4090 (5 094) et 6000 Ada (4 255). Son débit de 271.8 jetons/s démontre l'avantage de son pool mémoire plus important de 96 Go et de l'optimisation des paramètres de la station de travail pour l'inférence à contexte élevé.

Dans Llama3, la PRO 6000 a conservé son avance avec un score de 6 501, contre 6 104 pour la RTX 5090, 4 849 pour la 4090 et 4 026 pour la 6000 Ada. Cela souligne la cohérence de l'architecture Blackwell de NVIDIA, la PRO 6000 conservant des performances supérieures à mesure que les charges de travail des transformateurs augmentent en complexité et en longueur de contexte.

Enfin, dans Llama2, qui met l'accent sur l'inférence à long contexte et les performances soutenues, le PRO 6000 a atteint 8 008, tandis que les 5090, 4090 et 6000 Ada étaient à la traîne avec respectivement 6 591, 5 013 et 3 957. Malgré l'augmentation de la longueur des séquences et des temps d'inférence, le PRO 6000 a conservé une nette supériorité en termes de vitesse et de stabilité, réalisant les exécutions plus rapidement et avec un débit plus fluide que tous les autres GPU testés.

UL Procyon : Génération de texte par IA NVIDIA RTX PRO 6000 NVIDIA RTX 5090 NVIDIA RTX 4090 NVIDIA RTX 6000 Ada
Score global de Phi 6,775 5,749 4,958 4,508
Temps de sortie Phi vers le premier jeton 0.182 s 0.244 s 0.255 s 0.288 s
Jetons de sortie Phi par seconde 325.855 tok/s 314.435 tok/s 244.343 tok/s 228.359 tok/s
Durée totale de Phi 9.498 s 10.280 s 12.872 s 13.869 s
Mistral Note globale 7,346 6,267 5,094 4,255
Temps de sortie du Mistral jusqu'au premier jeton 0.229 s 0.297 s 0.322 s 0.419 s
Jetons de sortie Mistral par seconde 271.779 tok/s 255.945 tok/s 183.266 tok/s 166.633 tok/s
Durée totale du Mistral 11.493 s 12.593 s 17.010 s 19.092 s
Score global de Llama3 6,501 6,104 4,849 4,026
Temps de sortie de Llama3 vers le premier jeton 0.218 s 0.234 s 0.259 s 0.348 s
Jetons de sortie Llama3 par seconde 226.407 tok/s 214.285 tok/s 150.039 tok/s 138.620 tok/s
Durée totale de Llama3 13.554 s 14.304 s 19.991 s 22.062 s
Score global de Llama2 8,008 6,591 5,013 3,957
Temps de sortie de Llama2 vers le premier jeton 0.307 s 0.419 s 0.500 s 0.679 s
Jetons de sortie Llama2 par seconde 145.595 tok/s 134.502 tok/s 92.853 tok/s 78.532 tok/s
Durée totale de Llama2 20.712 s 23.018 s 32.448 s 38.923 s

UL Procyon : Génération d'images IA

Benchmark de génération d'images Procyon AI fournit une méthode cohérente et précise pour mesurer les performances d'inférence de l'IA sur différents matériels, des NPU basse consommation aux GPU haut de gamme. Il comprend trois tests : Stable Diffusion XL (FP16) pour les GPU haut de gamme, Stable Diffusion 1.5 (FP16) pour les GPU moyennement puissants et Stable Diffusion 1.5 (INT8) pour les appareils basse consommation. Ce benchmark utilise le moteur d'inférence optimal pour chaque système, garantissant des résultats justes et comparables.

En commençant par Stable Diffusion 1.5 (FP16), la NVIDIA RTX PRO 6000 a obtenu un score global impressionnant de 8 869, surpassant la RTX 5090 (8 193), la RTX 4090 (5 260) et la RTX 6000 Ada (4 230). La PRO 6000 a généré des images en 11.27 secondes, soit une moyenne de 0.705 seconde par image, ce qui en fait la carte la plus rapide de ce test. Cela démontre comment son réglage optimisé pour les stations de travail et ses 96 Go de mémoire GDDR7 permettent une production continue et de haute précision sans compromettre l'efficacité.

Lors du test Stable Diffusion 1.5 (INT8), qui mesure les performances d'inférence quantifiée légère, tous les GPU ont obtenu des résultats similaires. Le PRO 6000 a obtenu un score de 79 064, un score quasiment identique à celui de la RTX 5090 (79 272), tout en devançant la RTX 4090 (62 160) et la RTX 6000 Ada (55 901). Les charges de travail INT8 dépendant moins de la bande passante et de la capacité mémoire, les différences étaient minimes, mais le PRO 6000 a maintenu des résultats cohérents avec un temps de génération moyen de 0.395 seconde par image.

Le test Stable Diffusion XL (FP16) sollicite les GPU avec des exécutions d'inférence plus longues et plus exigeantes, sollicitant à la fois la mémoire et le débit de calcul soutenu. Ici, la PRO 6000 a obtenu un score global de 6 991, se classant juste derrière les 7 179 de la RTX 5090, mais largement devant les 5 025 de la RTX 4090 et les 3 043 de la RTX 6000 Ada. Elle a maintenu un temps de rendu total de 85.8 secondes, soit 5.36 secondes par image, démontrant que la PRO 6000 gère efficacement et sans ralentissement les charges de travail de génération étendue.

UL Procyon : Génération d'images par IA NVIDIA RTX PRO 6000 NVIDIA RTX 5090 NVIDIA RTX 4090 NVIDIA RTX 6000 Ada
Stable Diffusion 1.5 (FP16) – Note globale 8,869 8,193 5,260 4,230
Diffusion stable 1.5 (FP16) – Durée totale 11.274 s 12.204 s 19.011 s 23.639 s
Stable Diffusion 1.5 (FP16) – Vitesse de génération d'images 0.705 s/image 0.763 s/image 1.188 s/image 1.477 s/image
Stable Diffusion 1.5 (INT8) – Note globale 79,064 79,272 62,160 55,901
Diffusion stable 1.5 (INT8) – Durée totale 3.162 s 3.154 s 4.022 s 4.472 s
Stable Diffusion 1.5 (INT8) – Vitesse de génération d'images 0.395 s/image 0.394 s/image 0.503 s/image 0.559 s/image
Stable Diffusion XL (FP16) – Note globale 6,991 7,179 5,025 3,043
Stable Diffusion XL (FP16) – Durée totale 85.819 s 83.573 s 119.379 s 197.172 s
Stable Diffusion XL (FP16) – Vitesse de génération d'images 5.364 s/image 5.223 s/image 7.461 s/image 12.323 s/image

Mixeur 4.4

Blender est une application de modélisation 3D open source. Ce benchmark a été réalisé avec l'utilitaire Blender Benchmark. Le score est mesuré en échantillons par minute, les valeurs les plus élevées indiquant de meilleures performances.

Sur les trois scènes, la NVIDIA RTX PRO 6000 a dominé, démontrant les avantages de son architecture Blackwell et de sa capacité mémoire étendue. Dans la scène Monster, la PRO 6000 a enregistré 7 870,17 échantillons par minute, devant la RTX 5090 (7 421,50), suivie par la RTX 4090 et la RTX 6000 Ada (5 733,97 et 5 632,60 respectivement).

Sur la scène Junkshop, la PRO 6000 a conservé son avance avec 4 158,91 échantillons par minute, contre 3 980,15 pour la RTX 5090, 2 827,83 pour la RTX 4090 et 2 663,77 pour la RTX 6000 Ada. Enfin, sur la scène Classroom, qui privilégie à la fois le shading et l'efficacité mémoire, la PRO 6000 a atteint 4 041,11 échantillons par minute, devançant une fois de plus les 3 732,63 de la RTX 5090 et surpassant largement les RTX 4090 et RTX 6000 Ada, avec respectivement 2 909,35 et 2 818,83.

Blender 4.4 (plus c'est haut, mieux c'est) NVIDIA RTX PRO 6000 NVIDIA RTX 5090 NVIDIA RTX 4090 NVIDIA RTX 6000 Ada
Monster 7,870.17 7,421.50 5,733.97 5,632.60
Brocanteur 4,158.91 3,980.15 2,827.83 2,663.77
Salle de classe 4,041.11 3,732.63 2,909.35 2,818.83

marque de luxe

Luxmark est un benchmark GPU qui utilise LuxRender, un moteur de rendu open source par lancer de rayons, pour évaluer les performances d'un système dans le traitement de scènes 3D très détaillées. Ce benchmark est particulièrement pertinent pour évaluer les capacités de rendu graphique des serveurs et des stations de travail, notamment dans les applications d'effets visuels et de visualisation architecturale, où une simulation précise de la lumière est cruciale.

Lors du test de scène culinaire, la NVIDIA RTX PRO 6000 a dominé avec un score de 24 287, devançant la RTX 5090 (23 141), suivie par la RTX 4090 et la RTX 6000 Ada (17 171 et 14 873 respectivement). Cela démontre que la PRO 6000 maintient des performances de ray tracing fluides sur des charges de travail géométriques et d'éclairage très détaillées, sans perte de stabilité ni limitation thermique.

Dans la scène Hall plus exigeante, qui met l'accent sur la géométrie à grande échelle et l'éclairage global complexe, le PRO 6000 a de nouveau obtenu le meilleur résultat avec 52 588, juste devant les 51 725 du RTX 5090, et bien au-dessus du RTX 4090 (38 887) et du RTX 6000 Ada (32 132).

Luxmark (plus c'est élevé, mieux c'est) NVIDIA RTX PRO 6000 NVIDIA RTX 5090 NVIDIA RTX 4090 NVIDIA RTX 6000 Ada
Note alimentaire 24,287 23,141 17,171 14,873
Score de la salle 52,588 51,725 38,887 32,132

Geekbench 6

Geekbench 6 est un benchmark multiplateforme qui mesure les performances globales du système. Le navigateur Geekbench vous permet de comparer n'importe quel système à celui-ci.

Lors de ce test, la NVIDIA RTX PRO 6000 a obtenu un score OpenCL GPU de 384 158, surpassant ainsi la RTX 5090 (374 807), la RTX 4090 (333 384) et la RTX 6000 Ada (336 882). Ce score supérieur à celui de la PRO 6000 reflète sa conception optimisée pour station de travail, sa bande passante mémoire améliorée et sa pile de pilotes professionnels, qui, ensemble, garantissent des performances constantes sur un large éventail de charges de travail gourmandes en ressources de calcul.

Geekbench (plus c'est élevé, mieux c'est) NVIDIA RTX PRO 6000 NVIDIA RTX 5090 NVIDIA RTX 4090 NVIDIA RTX 6000 Ada
Score OpenCL du GPU 384,158 374,807 333,384 336,882

V-Ray

 V-Ray Benchmark mesure les performances de rendu des processeurs, des GPU NVIDIA, ou des deux, grâce aux moteurs avancés V-Ray 6. Il utilise des tests rapides et un système de notation simple pour permettre aux utilisateurs d'évaluer et de comparer les performances de leurs systèmes. C'est un outil essentiel pour les professionnels en quête d'analyses de performances performantes.

Lors de nos tests, la NVIDIA RTX PRO 6000 a obtenu 12 128 vpaths, la plaçant entre la RTX 5090, en tête avec 14 764, et la RTX 4090, qui a obtenu 10 847. La RTX 6000 Ada est légèrement en retrait avec 10 766. Si la RTX 5090 a conservé une légère avance dans ce test de rendu exigeant en ressources GPU, la PRO 6000 a affiché des performances solides et constantes, confirmant son réglage optimisé pour les stations de travail et son efficacité soutenue à pleine charge de rendu.

V-Ray (plus c'est élevé, mieux c'est) NVIDIA RTX PRO 6000 NVIDIA RTX 5090 NVIDIA RTX 4090 NVIDIA RTX 6000 Ada
chemins virtuels 12,128 14,764 10,847 10,766

Test d'inférence multi-modèles LM Studio

Pour cette série de tests, nous avons utilisé LM Studio afin d'évaluer les performances de la carte graphique NVIDIA RTX PRO 6000 sur une gamme de modèles de langages courants, notamment GPT-OSS 120B, Gemma 3 (4B, 12B et 27B), Llama 3.1 (8B et 70B) et Llama 3.3 70B. La même instruction a été appliquée à chaque modèle :

« Rédigez un article universitaire de 500 mots sur l’histoire des paresseux. »

L'accent principal de ce test est mis sur les jetons par seconde (débit) et le temps total (durée d'achèvement), qui mettent ensemble en évidence l'efficacité avec laquelle la RTX PRO 6000 gère différentes tailles et complexités de modèles dans des conditions de génération identiques.

Lors des tests d'inférence LM Studio, la NVIDIA RTX PRO 6000 a démontré d'excellentes performances et une évolutivité sur une large gamme de tailles de modèles, des modèles plus petits à 4 B paramètres aux configurations massives de classe 120 B.

Le point fort de ce test a été l'OpenAI GPT-OSS 120B, où la RTX PRO 6000 a produit 163.1 jetons par seconde et généré 500 mots en 9.54 secondes. Ce résultat est remarquable car les cartes comme la RTX 5090 ne peuvent pas charger ni exécuter un modèle de 120 B et ne parviennent souvent même pas à gérer des modèles de 70 B en raison d'une VRAM limitée. Les 96 Go de mémoire GDDR7 de la PRO 6000 lui permettent de traiter ces modèles volumineux localement, ce qui la rend unique parmi les GPU de station de travail.

Pour les modèles plus petits, la Gemma 3.4 B a atteint le débit le plus élevé, réalisant la tâche à 226.7 jetons par seconde en 3.51 secondes. La Llama 3.1 8B Instruct suivait de près, avec 197.1 jetons par seconde et un temps total de 4.17 secondes. Ces exécutions démontrent la grande efficacité et la réactivité de la PRO 6000 pour les charges de travail d'inférence de milieu de gamme.

À l'extrémité supérieure, les modèles Llama 3.1 70B Instruct et Llama 3.3 70B ont généré en moyenne environ 31.8 jetons par seconde avec des temps de génération totaux de 27.2 secondes et 25.3 secondes, affichant une sortie constante malgré leur grande taille.

Globalement, la RTX PRO 6000 offre une stabilité, un débit et des capacités exceptionnels pour l'exécution de modèles à grande échelle. Sa capacité de mémoire de 96 Go lui permet de gérer des charges de travail dépassant les limites des GPU grand public, ce qui en fait un excellent choix pour les développeurs, les chercheurs et les professionnels qui ont besoin de performances locales fiables pour l'IA avancée et le développement de modèles génératifs.

LM Studio (Résultats d'inférence de modèle)
Nom du modèle Jetons / s Temps jusqu'au premier jeton (s) Durée totale (s) Jetons d'invite Jetons prédits Total de jetons
OpenAI GPT-OSS 120B 163.15 0.193 9.543 81 1,557 1,638
Gemma 3 4B 226.73 0.113 3.51 25 796 821
Gemma 3 12B 117.15 0.068 8.06 25 944 969
Gemma 3 27B 68.06 0.221 12.048 25 820 845
Méta Llama 3.1 8B Instruct 197.07 0.062 4.171 49 822 871
Méta Llama 3.1 70B Instruct 31.84 0.159 27.227 49 867 916
Méta Lama 3.3 70B 31.74 0.323 25.329 49 804 853

Consommation d'énergie de la carte graphique NVIDIA RTX PRO 6000

Pour évaluer l'efficacité réelle des charges de travail d'IA, nous avons utilisé le benchmark UL Procyon AI Image Generation, et plus précisément le test Stable Diffusion XL FP16. Ce test analyse l'intervalle entre la deuxième et la dernière image générée, en capturant le temps nécessaire pour terminer l'intervalle, la consommation d'énergie maximale et continue, ainsi que la consommation d'énergie du système au repos après la fin de l'intervalle.

Lors de nos tests, la RTX PRO 6000 a maintenu une consommation système moyenne de 918.5 W en charge soutenue, avec un pic à 1 036,3 W, et une consommation au repos s'établissant à 152.3 W une fois la charge terminée. L'intervalle de test complet a duré 5.3 secondes, consommant au total 1.35 Wh. Ces résultats démontrent un excellent rapport puissance/performance pour un GPU de classe station de travail, maîtrisant parfaitement la consommation tout en maintenant un rendement élevé pendant les charges d'inférence prolongées.

Comparée aux autres GPU, la RTX PRO 6000 se rapproche de la RTX 4090 en termes de consommation énergétique totale, tout en conservant un temps d'exécution plus rapide. Elle surpasse également largement la RTX 6000 Ada en termes d'efficacité énergétique et de vitesse. Il est intéressant de noter que les nouvelles cartes Blackwell, qui partagent la puce GB202, affichent des caractéristiques d'efficacité très similaires sous cette charge de travail, avec seulement de légères différences en termes de consommation énergétique totale, probablement dues au TDP plus élevé de la PRO 6000. Cela indique que la dernière génération de NVIDIA continue d'affiner les performances par watt plutôt que de les modifier radicalement.

Puissance d'image utilisée par Stable Diffusion XL FP16 (plus c'est bas, mieux c'est) NVIDIA RTX PRO 6000 NVIDIA RTX 5090 NVIDIA RTX 4090 NVIDIA RTX 6000 Ada
Puissance consommée 1.35Wh 1.16Wh 1.35Wh 1.76Wh
Durée du test 5.3s 5.1s 7.3s 12.6s

Conclusion

La NVIDIA RTX PRO 6000 est, globalement, le GPU pour station de travail le plus performant du marché pour les workflows professionnels, offrant des performances dignes d'un centre de données dans un format compact. Affichée à un prix d'environ 8 500 $ au moment des tests, elle cible les équipes exigeant fiabilité, haute densité de calcul et un important pool de mémoire ECC pour les tâches de production. Avec 24 064 cœurs CUDA, 752 cœurs Tensor, 96 Go de mémoire GDDR7 ECC et l'architecture Blackwell, elle gère des charges de travail dépassant les limites pratiques des cartes grand public comme les GeForce RTX 5090 ou 4090. Les benchmarks individuels peuvent montrer qu'une carte grand public la surpasse en vitesse brute, mais globalement, en termes de capacité, de stabilité, de pilotes et de prise en charge ISV, la RTX PRO 6000 est la mieux adaptée à un usage professionnel.

Pour l'IA et le ML, le pool de 96 Go est la solution idéale. Il permet une inférence de contexte longue et des points de contrôle très volumineux localement, comme nous l'avons démontré en exécutant des modèles de classe de 70 à 120 milliards de dollars tout en maintenant des jetons forts par seconde. Le rendu et la simulation bénéficient également d'un cache L2 et d'une bande passante mémoire plus importants, offrant des performances prévisibles et soutenues dans Blender, V-Ray et LuxMark sous des charges prolongées.

La carte est compatible avec les stations de travail classiques. Elle est dotée d'une conception à double emplacement avec une interface PCIe 5.0 x16, quatre sorties DisplayPort 2.1b et une entrée d'alimentation 16 broches. Prévoyez une alimentation de qualité et une ventilation du châssis pour supporter la puissance de 600 W de la carte. L'utilisation de plusieurs GPU est également simple, avec la prise en charge par les OEM et les ISV de 2 à 8 GPU pour les piles d'IA, de rendu et de calcul.

Si votre travail implique des LLM de contexte longs, des scènes très volumineuses ou une simulation de haute précision sur un seul nœud, la RTX PRO 6000 justifie sa prime par une capacité et une cohérence que les autres cartes ne peuvent égaler.

Page produit Nvidia RTX PRO 6000

S'engager avec StorageReview

Bulletin d'information (en anglais) |  YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | Flux RSS

Dylan Dougherty

Administrateur réseau K-12 avec une expertise dans les solutions de réseau Cisco, de sécurité IP et de NAC. Passionné d'UniFi et ouvrier à domicile, testant et évaluant les produits de réseau et de sécurité.

Derniers Articles

Test du Lenovo ThinkCentre Neo 50q QC : PC ultra-compact Snapdragon

Le Lenovo ThinkCentre Neo 50q QC est un ordinateur de bureau compact, sécurisé et intelligemment conçu, alimenté par une plateforme basée sur Snapdragon.

Il y a 15 heures

Test du serveur HPE ProLiant DL380a Gen12 : Serveur 4U à refroidissement par air pour IA multi-GPU haute densité

Test du serveur HPE ProLiant DL380a Gen12 : un serveur IA 4U refroidi par air avec deux processeurs Xeon 6, des GPU serveur RTX PRO 6000 et une connectivité E3.S…

Il y a 4 jours

Test du GPU Intel Arc Pro B50 : un GPU pour station de travail abordable et basse consommation

Compacte et alimentée par un slot, la carte graphique Intel Arc Pro B50 offre une accélération fiable pour la conception, la visualisation et les tâches d'IA légères.

Il y a 4 jours

Test du Lexar Professional SILVER CFexpress 4.0 Type A

Test de la carte Lexar Professional SILVER CFexpress 4.0 : Bonnes performances et excellente durabilité pour les utilisateurs de Sony Alpha et FX, mais attendez-vous à…

Il y a 1 semaine

Test du HP EliteBook 6 G1q : Un ordinateur portable léger offrant une autonomie d’une journée entière

L'EliteBook 6 G1q de HP offre des performances IA optimisées par Snapdragon, une sécurité d'entreprise et une autonomie d'une journée entière pour les professionnels hybrides.

il y a 2 semaines

Test du Dell Pro Max 16 Premium : performances, portabilité et écran OLED net

Le Dell Pro Max 16 Premium offre des performances Core Ultra 2, un écran tactile OLED, des certifications ISV, un double stockage M.2 et une carte graphique RTX en option…

il y a 2 semaines