Startseite Unternehmen Dell PowerEdge R770 im Test: Modular, leistungsstark und KI-fähig

Dell PowerEdge R770 im Test: Modular, leistungsstark und KI-fähig

by Divyansh Jain

Dell PowerEdge R770-Test: Intel Xeon 6-CPUs, OCP DC-MHS-Modularität, beeindruckende Leistung, Flexibilität und KI-fähig in einem dichten 2U-Gehäuse.

Die Server der Dell PowerEdge R7x0-Serie sind seit langem ein Eckpfeiler von Rechenzentren und bekannt für ihre außergewöhnliche Verarbeitungsqualität, ihr durchdachtes Design, ihre Leistung, Dichte und Zuverlässigkeit im vielseitigen 2HE-Formfaktor. Diese Server wurden kontinuierlich weiterentwickelt, um den sich ändernden Anforderungen gerecht zu werden. Mit der Einführung des Dell PowerEdge R770 macht die Serie nun einen entscheidenden Schritt nach vorne.

TDer R770 präsentiert Intels neue Xeon 6-Prozessorfamilie mit den Xeon 6500 und 6700 P- und E-Core-Prozessoren. Dell setzt damit erstmals den OCP Data Center Modular Hardware System (DC MHS)-Standard in seiner Mainstream-Server-Produktlinie vollständig ein. Zusammen versprechen diese beiden Neuerungen eine deutliche Weiterentwicklung der Leistungsfähigkeit und Designphilosophie.

Dell PowerEdge R770 Hero-Blende

Anforderungen moderner Rechenzentren erfüllen

Die Markteinführung des R770 erfolgt zu einem Zeitpunkt, an dem Rechenzentren zunehmend unter Druck stehen. Die Arbeitslasten werden immer vielfältiger und anspruchsvoller. Das stetige Datenwachstum erfordert robuste Analysen und Datenbanken. Vom Training komplexer Modelle bis hin zur Echtzeit-Inferenz ist Künstliche Intelligenz keine Nischenanwendung mehr, sondern ein zentraler Geschäftstreiber, der erhebliche Rechenleistung und spezielle Beschleunigung erfordert.

Gleichzeitig liegt der Fokus stark auf Energieeffizienz und der Optimierung der Gesamtbetriebskosten. Darüber hinaus setzt die Branche zunehmend auf offene Standards, um Innovationen zu fördern, die Interoperabilität zu verbessern und die Abhängigkeit von einem bestimmten Anbieter zu reduzieren. Der R770 mit seinen neuen Prozessoroptionen und der Einführung von OCP DC MHS ist darauf ausgelegt, diese Herausforderungen direkt zu meistern.

Intel Xeon 6 P-Core-Prozessoren

Der R770-Prozessor nutzt die Prozessoren der Intel Xeon 6-Serie, einschließlich der 6700er und 6500er-Serie, und integriert die Performance- und Effizienzkerne auf der Sockel-E2-Plattform (LGA4710-2). In diesem Test konzentrieren wir uns speziell auf die Modelle der P-Serie.

Dell PowerEdge R770 CPU-Blöcke

Intel konstruiert diese Prozessoren in einem kachelbasierten Design, bei dem I/O-Kacheln mit einer oder zwei Compute-Kacheln kombiniert werden. Dies ermöglicht Skalierbarkeit innerhalb der Serie. Konfigurationen reichen bis zu 86 P-Cores (XCC) mit zwei Compute-Kacheln, bis hinunter zu 48 P-Cores (HCC) oder 16 P-Cores (LCC) mit einzelnen Compute-Kacheln.

Im Vergleich zu den Sapphire- und Emerald Rapids-Prozessoren der vorherigen Generation ist die universelle Verfügbarkeit integrierter Beschleuniger in allen Xeon 6-Prozessoren ein wesentliches Unterscheidungsmerkmal dieser Prozessoren. Dazu gehören die Intel QuickAssist-Technologie für Verschlüsselung und Komprimierung, der Intel Data Streaming Accelerator für die Datenübertragung, der Intel In-Memory Analytics Accelerator für die Beschleunigung von Datenbanken und Analysen sowie der Intel Dynamic Load Balancer für effiziente Netzwerkverarbeitung. 

Auch Speicher und I/O-Bandbreite wurden deutlich verbessert. Die Xeon 6700/6500 P-Core-Serie unterstützt 8-Kanal-DDR5-Speicher. Sie ebnet zudem den Weg für Multiplexed Rank DIMM (MRDIMM), das Geschwindigkeiten von bis zu 8,800 MT/s erreicht. Im I/O-Bereich unterstützen diese Prozessoren PCIe 5.0 und CXL 2.0. In Dual-Socket-Konfigurationen bietet die Plattform bis zu 88 PCIe-Lanes pro Sockel (insgesamt 176 Lanes). 

Trotz der Differenzierung zwischen P- und E-Core-Prozessoren bietet die Xeon 6-Familie einheitliche Befehlssätze, BIOS, Treiber, Betriebssystem-/Anwendungsunterstützung und RAS-Funktionen. Dies vereinfacht die Integration und Verwaltung verschiedener Bereitstellungstypen. Die P-Core-Varianten sind auf Workloads ausgerichtet, bei denen Leistung pro Kern, KI-Beschleunigung, hohe Speicherbandbreite und umfangreiche I/O-Leistung im Vordergrund stehen. Beispiele hierfür sind anspruchsvolle Datenbanken, HPC-Simulationen, erweiterte Analysen und eine breite Palette von KI-Anwendungen.

Technische Daten des Dell PowerEdge R770

Dell PowerEdge R770, hintere E/A

Normen Dell PowerEdge R770
Prozessor Zwei Intel Xeon 6 Prozessoren mit bis zu 144 E-Cores oder 86 P-Cores pro Prozessor
Memory 32 DDR5-DIMM-Steckplätze, unterstützt RDIMM 8 TB max., Geschwindigkeiten bis zu 6400 MT/s, unterstützt nur registrierte ECC DDR5-DIMMs
Speichercontroller Interner Boot: Boot-optimiertes Speichersubsystem (BOSS-N1 DC-MHS): HWRAID 1, 2 x M.2 NVMe SSDs oder M.2 Interposer-Board (DC-MHS): 2 x M.2 NVMe SSDs oder USB, Interne Controller: Front PERC H965i, Front PERC H975i, Front PERC H365i
Vordere und hintere Schächte
  • Keine Backplane-Konfiguration
  • Bis zu 8 x EDSFF E3.S Gen5 NVMe (SSD) max. 122.88 TB, auch mit FIO-Konfiguration,
  • Bis zu 16 x EDSFF E3.S Gen5 NVMe (SSD) max. 245.76 TB, auch mit FIO-Konfiguration,
  • Bis zu 32 x EDSFF E3.S Gen5 NVMe (SSD) max. 489.6 TB
  • Bis zu 8 x 2.5 Zoll SAS/SATA/NVMe (SSD) max. 122.88 TB
  • Bis zu 8 x 2.5 Zoll Universal, max. 245.6 TB, Bis zu 16 x 2.5 Zoll SAS/SATA (SSD), max. 61.44 TB
  • Bis zu 24 x 2.5 Zoll SAS/SATA (SSD) max. 92.16 TB,
  • Bis zu 16 x 2.5 Zoll SAS/SATA (SSD) + 8 x 2.5 Zoll NVME) max. 92.16 TB
  • Bis zu 40 x EDSFF E3.S Gen5 NVMe (SSD) max. 614.4 TB
  • Bis zu 4 x EDSFF E3.S Gen5 NVMe (SSD) max. 61.2 TB auf der Rückseite
Hot-Swap-Netzteile
  • 800 W Platin 100–240 VAC oder 240 VDC
  • 1100 W Platin 100–240 VAC oder 240 VDC
  • 1500 W Titan 100–240 VAC oder 240 VDC
  • 1100 W Titan 100–240 VAC oder 240 VDC
  • 3200 W Titan 200–240 VAC oder 240 VDC
  • 800 W Titan 100–240 VAC oder 240 VDC
  • 3200 W 277 VAC und 336 HVDC Titan
  • 1400 W -48 VDC 60 mm
  • 1500 W 277 VAC und 336 HVDC Titan
  • 2400 W Titan 100–240 VAC oder 240 VDC 1800 W HLAC Titan 200–240 VAC oder 240 VDC
Kühloptionen Luftkühlung und direkte Flüssigkeitskühlung (DLC ist eine Rack-Lösung und erfordert zum Betrieb Rack-Verteiler und eine Kühlverteilungseinheit (CDU))
Ventilatoren Hochleistungslüfter Silver (HPR SLVR)/Hochleistungslüfter Gold (HPR GOLD), bis zu 6 Hot-Swap-Lüfter
Abmessungen und Gewicht Höhe – 86.8 mm (3.42 Zoll), Breite – 482 mm (18.97 Zoll), Gewicht – 28.53 kg (62.89 Pfund), Tiefe (für hintere E/A-Konfiguration) – 802.40 mm (31.59 Zoll) mit Blende, 801.51 mm (31.56 Zoll) ohne Blende, Tiefe (für vordere E/A-Konfiguration) – 814.52 mm (32.07 Zoll) ohne Blende
Formfaktor 2U-Rack-Server
Eingebettete Verwaltung iDRAC, iDRAC Direct, iDRAC RESTful API mit Redfish, RACADM CLI, iDRAC Service Module (iSM), NativeEdge Endpoint, NativeEdge Orchestrator
Lünette Optionale Sicherheitsblende
Sicherheit Kryptografisch signierte Firmware, Data-at-Rest-Verschlüsselung (SEDs mit lokaler oder externer Schlüsselverwaltung), Secure Boot, Secured Component Verification (Hardware-Integritätsprüfung), Silicon Root of Trust, System Lockdown, System Lockdown (erfordert iDRAC10 Enterprise oder Datacenter), Chassis Intrusion Detection, TPM 2.0 FIPS, CC-TCG-zertifiziert
Netzwerkoptionen
  • 4 x OCP NIC 3.0-Karten (optional) und 1GbE, 10GbE, 25GbE, 100GbE und 400GbE
  • Steckplatz 4 1 x 8 oder 1 x 16 Gen5 OCP 3.0
  • Steckplatz 10 1 x 8 oder 1 x 16 OCP 3.0, Steckplatz 34 1 x 16 Gen5 OCP 3.0 auf Front-Riser
  • Steckplatz 38 1 x 16 Gen 5 OCP 3.0 auf Front-Riser
  • BOSS Steckplatz 34 1 x 4 BOSS, Steckplatz 6 1 x 4 BOSS
GPU-Optionen Bis zu 6 x 75 W FHHL oder bis zu 2 x 350 W DWFL
Ports Anschlüsse vorne: 1 x USB 2.0 Typ C-Anschluss, 1 x USB 2.0 Typ A-Anschluss (optional), 1 x Mini-DisplayPort (optional), 1 x DB9 Serial (mit Front-E/A-Konfiguration), 1 x dedizierter Ethernet-Anschluss für iDRAC-Verwaltung; Anschlüsse hinten: 1 x dedizierter Ethernet-Anschluss für iDRAC-Verwaltung, 1 x VGA, 2 x USB 3.1 Typ A-Anschlüsse; Anschlüsse intern: 1 x USB 3.1 Typ A-Anschluss
PCIe
  • Bis zu zwei PCIe-Steckplätze (x16-Anschlüsse)
  • Steckplatz 31 1 x 16 Gen5 Volle Höhe – Halbe Länge oder volle Länge auf dem vorderen Riser
  • Steckplatz 36 1 x 16 Gen5 Volle Höhe – Halbe Länge auf dem vorderen Riser
  • Bis zu acht PCIe-Steckplätze (x8- und x16-Anschlüsse)
  • Steckplatz 1 1 x 8 Gen5 Volle Höhe – Halbe Länge
  • Steckplatz 2: 1 x 16 Gen5, doppelte Breite, volle Länge oder 1 x 8 Gen5, volle Höhe – halbe Länge
  • Steckplatz 3: 1 x 16 Gen5 volle Höhe – halbe Länge oder 1 x 16 Gen5 niedriges Profil
  • Steckplatz 4 1 x 16 Gen5 volle Höhe – halbe Länge oder 1 x 8 Gen5 volle Höhe – halbe Länge oder 1 x 8 oder 1 x 16 OCP 3.0
  • Steckplatz 5: 2 x 16 Gen5, volle Höhe – halbe Länge oder 1 x 8 Gen5, volle Höhe – halbe Länge
  • Steckplatz 7 1 x 16 Gen5 volle Höhe – halbe Länge oder 1 x 16 Gen5 doppelte Breite volle Länge oder 1 x 8 Gen5 volle Höhe – halbe Länge, Steckplatz 8 1 x 16 Gen5 volle Höhe – halbe Länge oder 1 x 8 Gen5 volle Höhe – halbe Länge
  • Steckplatz 9 1 x 16 Gen5 volle Höhe – halbe Länge oder 1 x 8 Gen5 volle Höhe – halbe Länge oder 1 x 16 Low Profile – halbe Länge
Betriebssysteme und Hypervisoren Canonical Ubuntu Server LTS, Microsoft Windows Server mit Hyper-V, Red Hat Enterprise Linux, SUSE Linux Enterprise Server, VMware mit vSphere

Dell PowerEdge R770 setzt auf Modularität mit OCP DC MHS

Quelle von Server/DC-MHS – OpenComputer

Der Dell PowerEdge R770 bietet bemerkenswerte Fortschritte und mehr Flexibilität in seinem physischen Design und seiner Komponentenarchitektur und übernimmt den Data Center Modular Hardware System-Standard (OCP DC MHS) des Open Compute Project.

Dell PowerEdge R770 SSD – Rückansicht

Der R7 führt die Tradition der R0x770-Serie fort und bietet umfangreiche Konfigurationsmöglichkeiten für unterschiedliche Einsatzanforderungen. Ein wichtiges Novum dieser Produktreihe ist die Wahl zwischen einer traditionellen Rear-I/O-Konfiguration und einer Front-I/O-Konfiguration mit Kaltgangzugang. Dies bietet mehr Flexibilität für unterschiedliche Rechenzentrumslayouts und Wartungsanforderungen. Die Speicheroptionen sind ebenso vielseitig und reichen von rechenorientierten Knoten mit minimalem oder keinem lokalen Speicher bis hin zu hochdichten Konfigurationen mit bis zu 40 E3.S-Laufwerken für speicherzentrierte Workloads.

Um dem wachsenden Bedarf an beschleunigtem Computing, insbesondere für KI und HPC, gerecht zu werden, bietet der R770 umfangreiche Erweiterungsmöglichkeiten. Je nach Gehäuse- und Riser-Konfiguration kann der Server bis zu sechs Gen 5 x16 Full-Height, Full-Length (FHFL) PCIe-Karten aufnehmen. Darüber hinaus unterstützt er die Installation von zwei Dual-Width-GPUs und ist damit eine leistungsstarke Plattform für ein breites Aufgabenspektrum. OCP 3.0 Mezzanine-Steckplätze bieten Netzwerkflexibilität und unterstützen je nach Konfiguration entweder x8- oder x16-Karten.

Dell hat zudem mehrere Designverbesserungen zur Verbesserung von Wartungsfreundlichkeit und Zuverlässigkeit umgesetzt. Ein Paradebeispiel ist die Weiterentwicklung der BOSS-Karte (Boot Optimized Storage Solution). Der BOSS-Controller des R770, der zuvor über Kabel angeschlossen und in den PCIe-Riser integriert war, ist nun als OCP-standardisierte Karte implementiert, die direkt mit dem Motherboard verbunden ist und so den Verkabelungsaufwand reduziert. Der neue BOSS-Controller verfügt außerdem über schnellere NVMe M.2-Laufwerke und integrierte Kühlkörper für optimale Betriebstemperaturen und Leistung der Boot-Geräte. Eine weitere subtile, aber praktische Verbesserung für Techniker ist der Wechsel von herkömmlichen Jumpern zu benutzerfreundlicheren DIP-Schaltern für Funktionen wie das Löschen des NVRAM.

Der tiefgreifendste architektonische Wandel ist die vollständige Übernahme des OCP DC MHS-Standards. Dell begann bereits in früheren Generationen mit der Integration von OCP-Elementen, insbesondere durch die Einführung von OCP 3.0-Netzwerkadaptersteckplätzen. Der R770 geht noch einen Schritt weiter. Wichtige Komponenten entsprechen nun den OCP-Spezifikationen, darunter Host Processor Modules (HPM), allgemein als Motherboard bekannt, das Teile wie die Riser-Steckplätze, jetzt M-XIO-Anschlüsse, enthält. Der M-XIO-Anschluss bietet eine standardisierte Schnittstelle für Riser-Karten und erhöht so die Flexibilität und Aufrüstbarkeit. Der iDRAC ist außerdem als OCP DC-SCM (Server Control Module) implementiert.

Darüber hinaus verfügt der R770 über den neuen PICPWR-Stromanschluss für Peripheriegeräte wie GPUs und Backplanes. Dieser Anschluss stellt eine wichtige Neuerung dar, vereinfacht die Stromversorgung und ermöglicht eine Inline-Stromüberwachung.

Diese tiefe Integration standardisiert Schnittstellen und Formfaktoren über verschiedene Subsysteme hinweg. Dell legt Wert darauf, dass Anwender für garantierte Kompatibilität und Support nur validierte Komponenten verwenden sollten. Die zugrunde liegende Standardisierung macht viele Teile jedoch von Natur aus benutzerfreundlicher und potenziell auch in Zukunft über kompatible Systeme hinweg austauschbar.

Management und iDRAC

Der Dell PowerEdge R770 erweitert den bereits funktionsreichen und beliebten iDRAC 9 um die nächste Generation iDRAC 10. Diese verbessert die Systemadministration durch die nahtlose Integration mit dem Data Center Secure Control Module (DC-SCM). Diese Integration ermöglicht optimierte Firmware-Updates und Konfigurationsmanagement und gewährleistet so einen konsistenten und skalierbaren Betrieb in allen Rechenzentren. iDRAC 10 unterstützt zudem erweiterte Automatisierungs- und Überwachungsfunktionen und ermöglicht IT-Administratoren die effiziente Verwaltung großer Implementierungen ohne Kompromisse bei Leistung und Zuverlässigkeit..

Sicherheit ist ein Eckpfeiler der Verwaltungsfunktionen des R770. Dell implementiert hierfür robuste Pre-Boot- und Boot-Verifizierungsmechanismen. iDRAC 10 nutzt die siliziumbasierte Root-of-Trust-Technologie und stellt sicher, dass die gesamte Firmware, einschließlich BIOS und iDRAC, vor der Ausführung kryptografisch verifiziert wird. Diese unveränderliche, hardwarebasierte Sicherheitsmaßnahme schützt vor Malware-Manipulationen und Lieferkettenangriffen und bietet eine sichere Grundlage für den Systembetrieb. Darüber hinaus verfügt der R770 über quantensichere Boot-Protokolle, um neue kryptografische Bedrohungen abzuwehren und so seine Rolle beim Schutz kritischer Infrastrukturen weiter zu stärken..

Dells Engagement für die Sicherheit der Lieferkette zeigt sich im Design des R770, das einen umfassenden Chain-of-Trust-Authentifizierungsprozess nutzt. Jede Hardwarekomponente wird einer strengen Überprüfung mithilfe kryptografischer Signaturen unterzogen, die während der Herstellung eingebettet werden. Dieser Prozess stellt sicher, dass nur autorisierte Firmware und Komponenten verwendet werden, wodurch Risiken durch unbefugte Änderungen oder gefälschte Teile minimiert werden.

Bausteine ​​von KI-Fabriken

Der R770 ist mit zahlreichen GPU- und Gehäusekonfigurationen erhältlich und stellt somit eine vielseitige Plattform für ein breites Spektrum an KI-Workloads dar. Diese Flexibilität sowie seine robusten Speicher- und Netzwerkfunktionen machen ihn zu einer attraktiven Wahl für Unternehmen, die KI-Lösungen in KI-Fabriken einsetzen. KI-Fabriken umfassen die Infrastruktur und Tools, die für die Erstellung, das Training und den Einsatz von KI-Modellen im großen Maßstab erforderlich sind. Diese Fabriken sind für die Entwicklung fortschrittlicher Systeme wie autonomer Fahrzeuge und Robotik unerlässlich, da sie die Rechenleistung und die Datenpipelines bereitstellen, die für die effiziente Verarbeitung riesiger Datensätze erforderlich sind.

Die Entwicklung autonomer Fahrzeuge und Robotersysteme erfordert umfangreiche Trainingsdaten, die reale Szenarien widerspiegeln. NVIDIAs Cosmos NIM stellt einen bedeutenden Fortschritt in diesem Bereich dar und bietet Entwicklern ein leistungsstarkes Toolkit zur beschleunigten Erstellung und Bereitstellung physischer KI-Systeme wie World Foundational Models.

Weltstiftungsmodelle verstehen

World Foundation Models (WFMs) sind hochentwickelte neuronale Netzwerke, die reale Umgebungen simulieren und auf Grundlage verschiedener Eingaben präzise Ergebnisse vorhersagen. Im Gegensatz zu herkömmlichen KI-Modellen, die sich auf spezifische Aufgaben konzentrieren, verstehen WFMs die Dynamik der physischen Welt, einschließlich physikalischer und räumlicher Eigenschaften.. Sie können Videos aus Textaufforderungen, Bildern oder anderen Eingabedaten generieren und dabei Bewegung, Kraft und räumliche Beziehungen genau darstellen.

NVIDIA Cosmos NIMs: Ein Sprungbrett zu grundlegenden Weltmodellen

Die Cosmos NIMs von NVIDIA sind ein entscheidender Schritt zur Entwicklung globaler Grundlagenmodelle. Sie ermöglichen es Organisationen und KI-Laboren, synthetische Trainingsdaten zu generieren und die notwendigen Daten für das Training dieser KI-Modelle effizient zu skalieren. Wir haben die Cosmos Predict Modell, ein generalistisches Modell, das Weltzustände aus Text- oder Videoaufforderungen generiert und kontinuierliche Bewegungen durch die Vorhersage von Frames synthetisiert.

Dies sind einige interessante Ergebnisse, die wir mit Cosmos mit nur einem einzigen Bild aus unserem Labor erzielen konnten. Obwohl nicht fehlerfrei, ist das, was es aus nur einem einzigen Bild machen konnte, sehr beeindruckend.

Die Fähigkeit des R770, Hochleistungs-GPUs wie die NVIDIA H100 zu unterstützen, und seine robusten Speicher- und Netzwerkfunktionen machen ihn zu einer attraktiven Wahl für Unternehmen, die KI-Lösungen einsetzen möchten.

Durch die Nutzung der Funktionen des R770 können Unternehmen KI-Modelle wie Cosmos NIM effizient trainieren und einsetzen und so die Entwicklung autonomer Fahrzeuge und Robotersysteme beschleunigen. Die Leistung und Skalierbarkeit des R770 machen ihn zur idealen Plattform für die Verarbeitung der großen Datenmengen, die für das Training von KI-Modellen erforderlich sind. Dank seiner Vielseitigkeit unterstützt er ein breites Spektrum an KI-Workloads.

GPU-Direktspeicher

GPU Direct Storage ist eine Technologie, die den direkten Datentransfer zwischen Speichergeräten und GPUs ermöglicht und dabei CPU und Systemspeicher umgeht. Bei der herkömmlichen Datenübertragung werden Daten vom Speicher in den CPU-Speicher gelesen und anschließend in den GPU-Speicher kopiert. Dieser Prozess erfordert mehrere Datenkopien, was zu erhöhter Latenz und reduzierter Leistung führt. Die CPU fungiert als Engpass, da sie den Datentransfer zwischen Speicher und GPU bewältigen muss. GDS beseitigt diesen Engpass, indem es Speichergeräten ermöglicht, Daten direkt in den GPU-Speicher zu übertragen.

Wir haben eine GDSIO-Workloadanalyse auf einem Speichersystem mit 16 Laufwerken durchgeführt und dabei die Anzahl der verwendeten Laufwerke schrittweise erhöht, um die Speicherleistung und ihre Fähigkeit zur Sättigung einer PCIe Gen 5-GPU zu verstehen.

Das GDSIO-Lesediagramm veranschaulicht, wie sich die steigende Anzahl der KIOXIA CD8P SSDs auf den aggregierten und durchschnittlichen Lesedurchsatz im r770 auswirkt. Mit der Erhöhung der Laufwerksanzahl von einem auf vier steigt der aggregierte Lesedurchsatz zunächst schnell an und erreicht etwa 50.2 GiB/s. Dies deutet darauf hin, dass das System den PCIe Gen 5 x16 mit nur drei bis vier Laufwerken zum Laden von Daten auslasten kann. Ab fünf Laufwerken stagniert der aggregierte Durchsatz, was darauf hindeutet, dass zusätzliche Laufwerke keine signifikante Verbesserung bringen. Der durchschnittliche Lesedurchsatz pro Laufwerk bleibt bis zu vier Laufwerken stabil, sinkt dann aber mit zunehmender Anzahl an Laufwerken. Dieser Leistungsrückgang pro Laufwerk ist darauf zurückzuführen, dass sich mehr Laufwerke die verfügbare PCIe-Busbandbreite teilen und die Lesevorgänge einzelner Laufwerke reduziert werden.

Im Gegensatz dazu ist die Schreibleistung dieser Laufwerke deutlich geringer als ihre Leseleistung. Alle 16 Laufwerke erreichten eine Schreibbandbreite von 46.7 GiB/s, wobei die durchschnittliche Schreibleistung der Laufwerke nahezu konstant blieb. Da es sich um die niedrigeren Schreibleistungskapazitäten im KIOXIA CD8-Portfolio handelt, schneiden Versionen mit hoher Kapazität oder andere PCIe Gen5-SSDs besser ab.

Benchmarking Dell PowerEdge R770

Kommen wir zu den Benchmarks: Der R770 ist Dells Flaggschiff-Mainline-System und wird daher in vielen unterschiedlichen Umgebungen eingesetzt. Daher haben wir für diese Plattform eine umfassende Reihe von Benchmarks durchgeführt, um einen Eindruck von der Leistung der Plattform in verschiedenen Umgebungen zu vermitteln. Das Lenovo ThinkSystem SR630 V4 wurde in einigen Tests verglichen, um den Unterschied zwischen den Top-End-E-Core- und P-Core-CPUs aufzuzeigen.

Systemkonfiguration
  • ZENTRALPROZESSOR: 2x Intel Xeon 6787P (je 86 Kerne)
  • RAM: 32x Micron 64 GB Dual-Rank DDR5 6400 MT/s Gesamtspeicher: 2 TB
  • Netzteile: 2x Delta 1500W
  • GPU: 1x NVIDIA H100 für den TGI-Benchmark, 1x NVIDIA L4 für die restlichen Tests
  • Netzwerkkarte: DELL BRCM 4P 25G SFP 57504S OCP NIC
  • BOSS-Karte: BOSS-N1 DC-MHS-Festplatten 0 und 1 SK hynix 480 GB Dell NVMe ISE PE9010 RI M.2 480 GB
  • Festplatten: 0-5 in Backplane 1: Samsung 6.4 TB, Dell NVMe PM1745 MU E3.S 6.4 TB

KI-Workload-Leistung

Benchmark für die Textgenerierung

Text Generation Inference (TGI) ist ein leistungsstarker LLM-Inferenzserver, der von Hugging Face entwickelt wurde. Er optimiert die Bereitstellung und Nutzung von LLMs und ist daher ideal für Produktionsumgebungen. TGI unterstützt verschiedene Open-Source-LLMs und bietet Funktionen wie Tensor-Parallelität, Token-Streaming und kontinuierliches Batching, die Leistung und Effizienz steigern.

Textgenerierungsinferenz – QwQ 32B

Die Benchmarking-Funktion von TGI dient der Leistungsbewertung unter verschiedenen Konfigurationen und Workloads. Sie bietet eine genauere Darstellung der tatsächlichen Leistung, da sie die Komplexität der Bereitstellung von LLMs in einer Produktionsumgebung berücksichtigt.

Die Textgenerierung mit LLMs umfasst zwei Hauptphasen: die Vorfüllphase und die Dekodierungsphase. Die Vorfüllphase ist der erste Schritt, in dem das LLM die Eingabeaufforderung verarbeitet, um die erforderlichen Zwischendarstellungen zu generieren. Diese Phase ist rechenintensiv, da die gesamte Eingabeaufforderung in einem einzigen Durchlauf durch das Modell verarbeitet wird.

Während der Vorfüllphase wird die Eingabeaufforderung tokenisiert und in ein vom LLM verarbeitbares Format konvertiert. Anschließend berechnet der LLM den KV-Cache, der Informationen zu den Eingabetoken speichert. Der KV-Cache ist eine wichtige Datenstruktur, die die Generierung von Ausgabetoken erleichtert.

Im Gegensatz dazu ist die Dekodierungsphase ein autoregressiver Prozess, bei dem das LLM nacheinander Ausgabetoken generiert, aufbauend auf den in der Vorfüllphase generierten Zwischendarstellungen. Die Dekodierungsphase stützt sich stark auf den in der Vorfüllphase generierten KV-Cache, der den notwendigen Kontext für die Generierung kohärenter und kontextrelevanter Ausgabetoken bereitstellt.

Vorfüllphase

Wenn die Batchgröße von 1 auf 32 steigt, erhöht sich die Latenz für alle drei Modelle; die Latenz von DeepSeek-R1-Distill-Qwen-32 B steigt von 29.97 ms bei einer Batchgröße von 1 auf 76.95 ms bei einer Batchgröße von 32. Ebenso steigt die Latenz für GEMMA-3-27B-IT und Qwen/QwQ-32B von 51.84 ms bzw. 29.90 ms auf 79.58 ms bzw. 76.30 ms.

Im Gegensatz dazu verbessert sich die Token-Rate deutlich mit zunehmender Batch-Größe. Bei einer Batch-Größe von 1 liegen die Token-Raten für die drei Modelle zwischen 192.95 und 334.46 Token pro Sekunde. Bei einer Batch-Größe von 32 steigen sie auf 4158.67, 4021.40 bzw. 4194.13 Token pro Sekunde für DeepSeek-R1-Distill-Qwen-32B, GEMMA-3-27B-IT und Qwen/QwQ-32B.

Leistung der LLM-Vorfüllphase: Latenz (ms) und Token-Rate (Token/Sek.)
Batch-Größe DeepSeek-R1-Distill-Qwen-32B GEMMA-3-27B-IT Qwen/QwQ-32B
Latenzzeit (ms) Token-Kurs Latenzzeit (ms) Token-Kurs Latenzzeit (ms) Token-Kurs
1 29.97 333.64 51.84 192.95 29.90 334.46
2 30.21 662.09 52.55 380.61 29.95 667.80
4 32.40 1234.72 52.62 760.12 32.12 1245.47
8 36.98 2163.46 52.66 1519.19 36.69 2180.66
16 51.63 3125.50 60.96 2624.64 51.29 3147.61
32 76.95 4158.67 79.58 4021.40 76.30 4194.13
Dekodierungsphase

Im Gegensatz zur Vorfüllphase bleibt die Latenz während der Dekodierungsphase über verschiedene Batchgrößen hinweg relativ stabil. Beispielsweise variiert die Latenz von DeepSeek-R1-Distill-Qwen-32 B zwischen 27.14 ms und 29.52 ms, wenn die Batchgröße von 2 auf 32 steigt.

Die Token-Rate während der Dekodierungsphase verbessert sich mit zunehmender Batchgröße, wenn auch nicht so deutlich wie während der Vorfüllphase. Bei einer Batchgröße von 1 beträgt die Token-Rate etwa 36–37 Token pro Sekunde für DeepSeek-R1-Distill-Qwen-32B und Qwen/QwQ-32B sowie 33.96 Token pro Sekunde für GEMMA-3-27B-IT. Bei einer Batchgröße von 32 steigen die Token-Raten auf 1083.83, 873.39 bzw. 1084.89 Token pro Sekunde.

LLM-Dekodierungsleistung (Token): Latenz (ms) und Token-Rate (Token/Sek.)
Batch-Größe DeepSeek-R1-Distill-Qwen-32B GEMMA-3-27B-IT Qwen/QwQ-32B
Latenzzeit (ms) Token-Kurs Latenzzeit (ms) Token-Kurs Latenzzeit (ms) Token-Kurs
1 27.24 36.71 29.45 33.96 27.24 36.71
2 27.14 73.70 30.80 64.93 27.14 73.69
4 27.50 145.46 31.33 127.65 27.47 145.62
8 27.91 286.61 32.54 245.83 27.90 286.78
16 28.31 565.07 34.71 460.92 28.44 562.56
32 29.52 1083.83 36.64 873.39 29.50 1084.89

Dies ist erwartungsgemäß, da die Vorfüllphase anfängliche verborgene Zustände und Schlüssel-Wert-Caches für die gesamte Eingabeaufforderung berechnet. Dies kann die GPU gut auslasten, da große, gestapelte Operationen gleichzeitig ausgeführt werden können. Nach der Verarbeitung der Eingabeaufforderung generiert das Modell neue Token, in der Regel einzeln. In jedem Schritt verwendet das Modell das vorherige Token und die zwischengespeicherten verborgenen Zustände und erzeugt das nächste Token. Da diese Phase effektiv Token für Token abarbeitet, ist die Batchgröße oft klein, sodass die GPU häufig nicht ausgelastet ist.

Procyon AI Computer Vision Benchmark

Der Procyon AI Computer Vision Benchmark bewertet anhand realer Machine-Vision-Aufgaben die KI-Inferenzleistung von CPUs, GPUs und KI-Beschleunigern. Er unterstützt mehrere Inferenz-Engines wie TensorRT, OpenVINO, SNPE, Windows ML und Core ML und bietet Einblicke in Effizienz, Kompatibilität und Optimierung.

Die Ergebnisse des Procyon AI Computer Vision Benchmarks zeigen ebenfalls eine starke KI-Inferenzleistung. Das System erreichte niedrige Inferenzzeiten mit MobileNet V3 von 20.64 ms und ResNet 50 von 22.42 ms. Inception V4 und DeepLab liefen mit 65.23 ms bzw. 41.37 ms und bewältigten so auch komplexere Vision-Workloads effektiv. YOLO V3, ein wichtiges Objekterkennungsmodell, benötigte 37.80 ms und eignet sich daher gut für Echtzeit-KI-Anwendungen. REAL-ESRGAN, ein rechenintensives Super-Resolution-Modell, erreichte 1,159.22 ms, was uns einen AI Computer Vision-Gesamtwert von 81 Punkten einbrachte.

KI-Computervision (Kürzere Dauer ist besser) (Höhere Punktzahl ist besser) Dell PowerEdge R770 (2x Intel Xeon 6787P | 2 TB RAM)
MobileNet V3 Durchschnittliche Inferenzzeit 20.64 ms
ResNet 50 Durchschnittliche Inferenzzeit 22.42 ms
Durchschnittliche Inferenzzeit von Inception V4 65.23 ms
Durchschnittliche Inferenzzeit von DeepLab 41.37 ms
YOLO V3 Durchschnittliche Inferenzzeit 37.80 ms
Durchschnittliche Inferenzzeit von REAL-ESRGAN 1,159.22 ms
Gesamtpunktzahl für KI-Computervision 81

Hammer DB TPROC-C

Wir haben außerdem die Leistung von vier beliebten Open-Source-Datenbanken – MariaDB 11.4.4, MySQL 8.4.4, MySQL 5.7.44 und PostgreSQL 17.2 – mithilfe des HammerDB TPROC-C-Benchmarks bewertet, um OLTP-Workloads in 500 Lagern zu simulieren.

MariaDB erwies sich als Spitzenreiter, insbesondere in Dual-Socket-Konfigurationen, wo es effektiv skalierte und den höchsten Transaktionsdurchsatz erreichte. MySQL 8.4.4 zeigte deutliche Verbesserungen gegenüber der Vorgängerversion 5.7.44 und verdeutlichte die Verbesserungen in den letzten Versionen. PostgreSQL 17.2 lieferte eine konstante Leistung, blieb aber leicht hinter MariaDB und MySQL 8.4.4 zurück. MariaDB erreichte 3.15 Millionen TPM auf einem Single-Socket und 5.8 Millionen TPM auf Dual-Sockets und übertraf damit in beiden Szenarien die anderen.

Leistungsvergleichstabelle (Transaktionen pro Minute, TPM)

Datenbankmodul Einzelsockel-TPM Dual-Socket-TPM
Maria DB 11.4.4 3,150,000 5,800,000
MySQL 8.4.4 2,850,000 5,150,000
PostgreSQL 17.2 2,700,000 4,900,000
MySQL 5.7.44 2,300,000 4,250,000

Trotz der leistungsstarken Hardware des R770, einschließlich 86 Kernen pro CPU (einer Mischung aus Kernen mit hoher und niedriger Priorität), zeigte keine der Datenbanken signifikante Leistungssteigerungen, wenn sie auf beide Sockel verteilt wurden. Dies spiegelt die allgemeine Präferenz von Open-Source-Datenbanken für die Ausführung auf einem Sockel aufgrund der besseren Kernlokalität und der geringeren Speicherlatenz wider.

Angesichts dieser Ergebnisse eignet sich der R770 besser für den Betrieb mehrerer Datenbankinstanzen in einer virtualisierten Umgebung als für die Skalierung einer einzelnen Instanz. Die Systemarchitektur ist ideal für die Unterstützung hochdichter, gemischter Datenbank-Workloads und nutzt sowohl Performance- als auch Effizienzkerne, um einen konsistenten Durchsatz über viele Instanzen hinweg zu gewährleisten.

7-Zip

Der integrierte Speicherbenchmark des beliebten Dienstprogramms 7-Zip misst die Leistung der CPU und des Speichers eines Systems während Komprimierungs- und Dekomprimierungsaufgaben und gibt an, wie gut das System datenintensive Vorgänge verarbeiten kann.

Im 7-Zip-Benchmark erzielte das Dell-System bei Komprimierungsaufgaben eine höhere Bewertung (266.425 GIPS) als das Lenovo-System (224.313 GIPS), wobei das Dell-System eine etwas geringere CPU-Auslastung aufwies. Bei der Dekomprimierung schnitt Lenovo jedoch besser ab als Dell und erzielte eine höhere Bewertung (288.457 GIPS gegenüber 256.154 GIPS) und eine etwas höhere CPU-Auslastung. Dell erzielte eine geringfügig höhere Gesamtbewertung (261.290 GIPS) und zeigte damit eine bessere Gesamteffizienz sowohl bei Komprimierungs- als auch bei Dekomprimierungsaufgaben.

7-Zip Komprimierung & Dekompression Dell PowerEdge R770 (2x Intel Xeon 6787P | 2 TB RAM) Lenovo ThinkSystem SR630 V4 (2 x Intel Xeon 6780E | 512 GB RAM)
Komprimieren – Aktuelle CPU-Auslastung 5267 % 5064 %
Komprimieren – Aktuelle Bewertung/Nutzung 5.061 GIPS 4.341 GIPS
Komprimieren – Aktuelle Bewertung 266.591 GIPS 219.840 GIPS
Komprimieren – resultierende CPU-Auslastung 5270 % 5156 %
Komprimieren – Resultierende Bewertung/Nutzung 5.056 GIPS 4.350 GIPS
Komprimieren – Resultierende Bewertung 266.425 GIPS 224.313 GIPS
Dekomprimieren – Aktuelle CPU-Auslastung 5623 % 6184 %
Dekomprimieren – Aktuelle Bewertung/Nutzung 4.586 GIPS 4.688 GIPS
Dekomprimieren – Aktuelle Bewertung 257.909 GIPS 289.879 GIPS
Dekomprimieren – resultierende CPU-Auslastung 5627 % 6205 %
Dekomprimieren – resultierende Bewertung/Nutzung 4.553 GIPS 4.649 GIPS
Dekomprimieren – Resultierende Bewertung 256.154 GIPS 288.457 GIPS
Gesamt – Gesamte CPU-Auslastung 5448 % 5681 %
Gesamt – Gesamtbewertung/Nutzung 4.804 GIPS 4.500 GIPS
Gesamt – Gesamtwertung 261.290 GIPS 256.385 GIPS

Y-Cruncher

y-cruncher ist eine beliebte Benchmarking- und Stresstest-Anwendung, die 2009 auf den Markt kam. Dieser Test ist multithreaded und skalierbar und berechnet Pi und andere Konstanten bis in den Billionenbereich. Bei diesem Test ist schneller besser. Diese Software hat sich hervorragend zum Testen von Plattformen mit vielen Kernen bewährt und zeigt Rechenvorteile zwischen Single- und Dual-Socket-Plattformen.

Die Y-Cruncher-Benchmark-Ergebnisse zeigen eine deutliche Leistungslücke zwischen dem Dell PowerEdge R770 mit P-Core-CPUs und dem Lenovo ThinkSystem SR630 V4 mit E-Core-CPUs, insbesondere bei zunehmender Datenmenge. Dabei geht es weniger darum, welches System besser ist, sondern vielmehr darum, wie die CPU-Typen unter dieser Belastung im Vergleich abschneiden.

Bei kleineren Berechnungen lag das Dell-System bereits vorne und berechnete 1 Milliarde Stellen von Pi in 2.753 Sekunden, während das Lenovo-System mit 5.997 Sekunden mehr als doppelt so lange brauchte. Mit zunehmender Arbeitslast vergrößerte sich der Abstand. Bei 10 Milliarden Stellen war das Dell-System in 34.873 Sekunden fertig – weniger als halb so lange wie das Lenovo-System mit 81.046 Sekunden. Bei der 50-Milliarden-Stellen-Marke behauptete Dell seinen Vorsprung und erledigte die Aufgabe in 221.255 Sekunden, während Lenovo 476.826 Sekunden benötigte, was Dell 53 % schneller machte.

Bei 100 Milliarden Stellen konnte Lenovo den Test aufgrund seiner aktuellen Konfiguration mit 512 GB RAM nicht abschließen. Dell bewältigte die Arbeitslast mit 2 TB RAM effizient und beendete sie in 491.737 Sekunden.

Y-Cruncher (kürzere Dauer ist besser) Dell PowerEdge R770 (2x Intel Xeon 6787P | 2 TB RAM) Lenovo ThinkSystem SR630 V4 (2 x Intel Xeon 6780E | 512 GB RAM)
1 Milliarden 2.753 Sekunden 5.997 Sekunden
2.5 Milliarden 7.365 Sekunden 17.573 Sekunden
5 Milliarden 16.223 Sekunden 37.793 Sekunden
10 Milliarden 34.873 Sekunden 81.046 Sekunden
25 Milliarden 99.324 Sekunden 220.025 Sekunden
50 Milliarden 221.255 Sekunden 476.826 Sekunden
100 Milliarden 491.737 Sekunden

Mixer OptiX

Eine Open-Source-Anwendung für 3D-Modellierung. Dieser Benchmark wurde mit dem Blender Benchmark-Tool durchgeführt. Die Punktzahl wird in Samples pro Minute angegeben, wobei mehr Samples besser sind.

Die Blender-Benchmark-Ergebnisse zeigen einen deutlichen Leistungsvorteil des Dell PowerEdge R770 gegenüber dem Lenovo ThinkSystem SR630 V4, insbesondere beim CPU-Rendering. In der CPU-Monster-Szene erreichte Dell 1,706.002 Samples pro Minute und damit 19 % mehr als Lenovo mit 1,432.09 Samples pro Minute. Der CPU-Junkshop-Test verdeutlichte diesen Unterschied noch deutlicher: Dell erreichte 1,169.370 Samples pro Minute und übertraf damit Lenovo mit 914.75 Samples pro Minute um 28 %. Ähnlich verhält es sich mit Dell im CPU-Classroom-Test mit 791.475 Samples pro Minute, während Lenovo mit 656.68 Samples pro Minute – einem Unterschied von 20 % – zurückblieb.

Das Fehlen einer GPU im Lenovo-System bedeutete auch, dass es nicht am GPU-basierten Rendering teilnehmen konnte, wo Dells NVIDIA L4 einen Wert von 1,895.71 Samples/Min für Monster, 950.42 Samples/Min und einen Classroom-Wert von 968.43 Samples/Min zeigte.

Blender CPU-Benchmark Dell PowerEdge R770 (2x Intel Xeon 6787P | 2 TB RAM) Lenovo ThinkSystem SR630 V4 (2 x Intel Xeon 6780E | 512 GB RAM)
CPU-Monster (Blender 4.3) 1,706.002 Proben/Min 1432.09 Proben/Min
CPU-Schrottladen (Blender 4.3) 1,169.370 Proben/Min 914.75 Proben/Min
CPU-Klassenzimmer (Blender 4.3) 791.475 Proben/Min 656.68 Proben/Min
GPU-Monster (Blender 4.3) 1,895.712 Proben/Min (keine GPU)
GPU-Junkshop (Blender 4.3) 950.424 Proben/Min (keine GPU)
GPU-Klassenzimmer (Blender 4.3) 968.432 Proben/Min (keine GPU)

Cinebench R23

Das Benchmarktool Cinebench R23 bewertet die CPU-Leistung eines Systems, indem es eine komplexe 3D-Szene mit der Cinema 4D-Engine rendert. Es misst die Single-Core- und Multi-Core-Leistung und bietet einen umfassenden Überblick über die Fähigkeiten der CPU bei der Bewältigung von 3D-Rendering-Aufgaben.

Im Cinebench R23 zeigen die Benchmark-Ergebnisse deutliche Unterschiede in der CPU-Leistung zwischen dem Dell PowerEdge R770 und dem Lenovo ThinkSystem SR630 V4, insbesondere hinsichtlich der Anzahl der Kerne pro Prozessor. Das Lenovo ThinkSystem SR630 V4, ausgestattet mit zwei Intel Xeon 2E Prozessoren (6780 Kerne pro Prozessor), übertraf das Dell im CPU-Multi-Core-Test mit 144 Punkten, während das Dell nur 99,266 Punkte erreichte. Dieser Unterschied spiegelt Lenovos Vorteil bei Multithread-Workloads wider, dank der höheren Kernanzahl (insgesamt 74,710 Kerne) im Vergleich zu Dells zwei Intel Xeon 288P Prozessoren (2 Kerne pro Prozessor), die die Multi-Core-Leistung einschränken.

Im CPU-Single-Core-Test schnitt Dell mit 1,272 Punkten besser ab und übertraf Lenovos 894 Punkte. Dies unterstreicht die überlegene Single-Thread-Effizienz von Dell trotz der geringeren Kernanzahl.

Cinebench R23 Dell PowerEdge R770 (2x Intel Xeon 6787P | 2 TB RAM) Lenovo ThinkSystem SR630 V4 (2 x Intel Xeon 6780E | 512 GB RAM)
CPU-Mehrkern 74,710 pts 99,266 pts
CPU Single-Core 1,272 pts 894 pts
MP-Verhältnis 58.74 x 111.00 x

Cinebench 2024

Cinebench 2024 erweitert die Benchmark-Funktionen von R23 um eine GPU-Leistungsbewertung. Es testet weiterhin die CPU-Leistung, umfasst aber auch Tests, die die Fähigkeit der GPU messen, Rendering-Aufgaben zu bewältigen.

In diesem aktualisierten Benchmark erreichte der Dell PowerEdge R770 12,996 Punkte für die GPU-Leistung und unterstrich damit seine Fähigkeit, GPU-beschleunigte Rendering-Aufgaben zu bewältigen. Das Lenovo ThinkSystem SR630 V4 verfügt nicht über eine dedizierte GPU und erreichte daher keinen GPU-Score.

Im CPU-Multi-Core-Test erreichte das Lenovo 2,884 Punkte und lag damit knapp vor dem Dell mit 2,831 Punkten. Dies deutet auf einen leichten Vorsprung des Lenovo in der Multi-Core-Leistung hin. Im CPU-Single-Core-Test übertraf das Dell das Lenovo mit 71 Punkten, während das Lenovo 53 Punkte erreichte. Dies verdeutlicht die höhere Single-Core-Leistung des Dell trotz der geringeren Anzahl an Kernen.

Cinebench R24 Dell PowerEdge R770 (2x Intel Xeon 6787P | 2 TB RAM) Lenovo ThinkSystem SR630 V4 (2 x Intel Xeon 6780E | 512 GB RAM)
GPU-Ergebnis 12,996 pts
CPU-Mehrkern 2,831 pts 2,884 pts
CPU Single-Core 71 pts 53 pts
MP-Verhältnis 39.77 x 54.43 x

Geekbench 6

Geekbench 6 ist ein plattformübergreifender Benchmark, der die Gesamtsystemleistung misst. Mit dem Geekbench-Browser können Sie jedes beliebige System damit vergleichen.

Die Ergebnisse des Geekbench 6-Benchmarks zeigen deutliche Leistungsunterschiede zwischen dem Dell PowerEdge R770 und dem Lenovo ThinkSystem SR630 V4. Im CPU-Single-Core-Test übertraf der Dell den Lenovo mit einem Ergebnis von 1,797 Punkten, während der Lenovo 1,173 Punkte erreichte. Dies bedeutet eine Verbesserung der Single-Core-Leistung des Dell um 53 %.

Im CPU-Multi-Core-Test führte Dell erneut mit 15,880 Punkten, während Lenovo 13,868 Punkte erreichte, was Dell einen Vorsprung von 14 % bei der Multi-Core-Leistung verschafft. Dies deutet darauf hin, dass Dells Intel Xeon 6787P-Prozessoren insgesamt eine überlegene Rechenleistung bieten, insbesondere bei Aufgaben, die von mehreren Kernen profitieren.

Der GPU-OpenCL-Test verdeutlichte Dells Vorteil noch weiter und erreichte dank der NVIDIA L148,730-GPU ein Ergebnis von 4.

Geekbench 6 (Höher ist besser) Dell PowerEdge R770 (2x Intel Xeon 6787P | 2 TB RAM) Lenovo ThinkSystem SR630 V4 (2 x Intel Xeon 6780E | 512 GB RAM)
CPU Single-Core 1,797 1,173
CPU-Mehrkern 15,880 13,868
GPU OpenCL-Wertung 148,730 (keine GPU)

Blackmagic RAW-Geschwindigkeitstest

Der Blackmagic RAW Speed ​​Test ist ein Leistungsbenchmarking-Tool, das die Leistungsfähigkeit eines Systems bei der Videowiedergabe und -bearbeitung mit dem Blackmagic RAW-Codec misst. Es wird bewertet, wie gut ein System hochauflösende Videodateien dekodieren und wiedergeben kann, und bietet Bildraten sowohl für die CPU- als auch für die GPU-basierte Verarbeitung.

Im CPU-Test erreichte der Dell PowerEdge R770 141 FPS und übertraf damit das Lenovo ThinkSystem SR630 V4 mit 120 FPS. Dies deutet darauf hin, dass das Dell-System die CPU-basierte Videoverarbeitung effizienter bewältigt als das Lenovo-System. Im GPU-Test erreichte der Dell PowerEdge R770 157 FPS und profitierte dabei von der NVIDIA-GPU.

Blackmagic RAW-Geschwindigkeitstest (höher ist besser) Dell PowerEdge R770 (2x Intel Xeon 6787P | 2 TB RAM) Lenovo ThinkSystem SR630 V4 (2 x Intel Xeon 6780E | 512 GB RAM)
FPS-CPU 141 FPS 120 FPS
FPS CUDA 157 FPS 0 FPS (keine GPU)

Blackmagic Disk Speed ​​Test

Der Blackmagic Disk Speed ​​Test vergleicht die Lese- und Schreibgeschwindigkeit eines Laufwerks und schätzt seine Leistung, insbesondere für Videobearbeitungsaufgaben. Er hilft Benutzern sicherzustellen, dass ihr Speicher schnell genug für hochauflösende Inhalte wie 4K- oder 8K-Videos ist.

Im Blackmagic-Geschwindigkeitstest erreichte die Dell PowerEdge R770 Boss-Karte mit gespiegelter SK hynix 480GB Dell NVMe eine Lesegeschwindigkeit von 3,010.3 MB/s und eine Schreibgeschwindigkeit von 976.3 MB/s.

Fazit

Der Dell PowerEdge R770 begeistert uns besonders, da er den Data Center Modular Hardware System-Standard des Open Compute Projects und modernste Hardware integriert. Die Integration von OCP DC MHS bietet zahlreiche Vorteile, darunter verbesserte Modularität, verbesserte Wartungsfreundlichkeit und potenziell geringere Kosten durch verstärkte Standardisierung. Diese Designphilosophie spiegelt sich in allen Aspekten des Systems wider, von der Implementierung von iDRAC als OCP DC-SCM bis hin zu den Ports.

Der R770 überzeugt zudem mit beeindruckenden Speicherkapazitäten und unterstützt bis zu 40 E3.S-Laufwerke in einem einzigen 2HE-Gehäuse. Damit ist er die ideale Lösung für speicherintensive Workloads. Die Flexibilität des Servers wird zusätzlich durch die Unterstützung verschiedener Konfigurationen, einschließlich einer Front-I/O-Cold-Aisle-Accessible-Konfiguration, erhöht. Dies bietet mehr Flexibilität für unterschiedliche Rechenzentrumslayouts und Wartungsanforderungen.

Mit Unterstützung für eine breite Palette an GPUs und Intel Xeon 6 Performance Core CPUs ist der R770 eine leistungsstarke und vielseitige Serverplattform, die den Anforderungen moderner Rechenzentren optimal gerecht wird. Dank modernster Hardware, modularem Design und robusten Sicherheitsfunktionen ist der R770 eine attraktive Option für Unternehmen, die KI, HPC und traditionelle Enterprise-Workloads einsetzen möchten.

Dell PowerEdge

Beteiligen Sie sich an StorageReview

Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS Feed