Die DGX Spark-Plattform ist uns mittlerweile bestens vertraut. Wir haben sie bereits getestet. Dell, ASUS, Acer und Gigabyte annimmt NVIDIAs GB10 Grace Blackwell ReferenzdesignDie Kernkomponenten sind bei allen Geräten identisch: 1,000 TOPS FP4-Rechenleistung, 128 GB einheitlicher LPDDR5x-Speicher und duales 200GbE-Netzwerk in einem 150-mm-Gehäuse. Die HP ZGX Nano G1n AI Station baut auf dieser Grundlage auf, doch die Art und Weise, wie HP sie entwickelt hat, hebt dieses Gerät von anderen Spark-Produkten ab.
Die auffälligsten Unterschiede liegen in den Materialien und der Konstruktion. HP verwendet für den ZGX Nano ein Gehäuse aus bis zu 75 % recyceltem Aluminium und 20 % recyceltem Stahl, die Verpackung besteht zu bis zu 93 % aus Recyclingmaterial. Die interne Anordnung teilt das Gehäuse in eine obere und eine untere Hälfte, wodurch Komponenten wie die SSD und die Knopfzelle leichter zugänglich sind als bei einigen der von uns getesteten Spark-Geräte. Laut HP liegt der Geräuschpegel im Leerlauf bei 22 dBA und unter Volllast bei 27.6 dBA – ein leiser Wert für ein System mit einer maximalen Wärmeabgabe von ca. 780 BTU/h.
Im Bereich Sicherheit geht HP weit über die Referenzplattform hinaus. Der ZGX Nano ist mit TPM 2.0 im FIPS 140-2-zertifizierten Modus ausgestattet, erfüllt die Common Criteria EAL4+ und bietet sicheres Booten auf BIOS-Ebene sowie PXE-Steuerung. Der Speicher ist werkseitig als selbstverschlüsselndes OPAL NVMe-Laufwerk installiert. Insgesamt positioniert HP dieses Gerät nicht nur als KI-Knoten für Entwickler am Arbeitsplatz, sondern auch als System für regulierte Umgebungen, in denen Lieferkettenzertifizierungen, Verschlüsselung ruhender Daten und Manipulationssicherheit für die Beschaffung entscheidend sind.
| Normen | HP ZGX Nano G1n AI Station |
|---|---|
| Übersicht | |
| Produktname | HP ZGX Nano G1n AI Station |
| Formfaktor | Mini |
| Betriebssystem | NVIDIA DGX OS 7 / Ubuntu 24.04 HINWEIS: Dieses Produkt unterstützt Microsoft Windows nicht. |
| Hardware | |
| Prozessor | NVIDIA GB10 Grace Blackwell Superchip Blackwell-Architektur-GPU 20-Kern-Arm-CPU (10x Cortex-X925 + 10x Cortex-A725) Blackwell CUDA-Kerne Tensor-Kerne der 5. Generation RT-Kerne der 4. Generation 1x NVENC 1x NVDEC |
| Memory | 128 GB LPDDR5x, Unified-Speicher, 16 Kanäle, verlötet |
| Speicherbandbreite | 273 GB / s |
| Speicher (Interne E/A) | 1x M.2 PCIe Gen5 x4 Optionen: 2 TB oder 4 TB PCIe Gen4 x4 NVMe (2242, SED OPAL TLC) |
| Netzwerk & E/A | |
| Hintere E / A-Anschlüsse | 1x USB-C-Netzteil (240 W) 3x USB-C 20 Gbit/s (DisplayPort 1.4a, gesamt 30 W) 1xHDMI 2.1a 1x 10GbE RJ-45 2x QSFP 200GbE (ConnectX-7) |
| Netzwerkcontroller | Realtek RTL8127-CG 10GbE NVIDIA ConnectX-7 200GbE |
| WLAN & Bluetooth | AzureWave AW-EM637 WLAN 7 + Bluetooth 5.4 |
| Leistung | |
| KI-Berechnung | Bis zu 1,000 TOPS (FP4) |
| Modellkapazität | Bis zu 200 B Parameter |
| Physische Kräfte und Kraft | |
| Abmessungen (H x B x T) | 2.01″ (ohne Füße) / 2.1″ (mit Füßen) 5.9" x 5.9" |
| Gewicht | Ab 1.25 kg (2.76 lbs) |
| Labor-Stromversorgungen | 240-W-USB-C-Netzteil, 89 % Wirkungsgrad, aktive PFC |
Aufbau und Design
Der HP ZGX Nano G1n verfolgt im Vergleich zu den bisher betrachteten Systemen einen deutlich anderen Ansatz beim DGX Spark-Design (siehe unseren Artikel). Dell/ASUS/Acer/Gigabyte Anstatt wie üblich die Komponenten in einer oberen Abdeckung zu verstecken, teilt HP das Gehäuse in eine obere und eine untere Hälfte. Dadurch wird der interne Aufbau im Inneren übersichtlicher. Was zunächst komplizierter erscheint, erweist sich als recht praktisch: Nach dem Lösen weniger Schrauben sind Komponenten wie die Knopfzelle und die SSD leicht zugänglich. Diese durchdachte interne Struktur spiegelt sich auch im äußeren Erscheinungsbild wider, bei dem HP besonderen Wert auf die Konstruktion und die verwendeten Materialien legt.
HP verpackt das Gerät in ein elegantes schwarzes Gehäuse mit einer Grundfläche von 150 mm x 150 mm und setzt dabei stark auf Recyclingmaterialien. Konkret besteht das Gehäuse zu bis zu 75 % aus recyceltem Aluminium, zu 20 % aus recyceltem Stahl und zu einem erheblichen Teil aus recycelten Kunststoffen. Selbst die Verpackung spiegelt dieses Engagement wider. Die Wellpappe enthält bis zu 93 % Recyclingmaterial, und die Kunststoffverpackung besteht zu mindestens 30 % aus Recyclingmaterial.
Thermisch setzt das System auf Zwangsluftkühlung. Dies ist angesichts der hohen Leistungsdichte des NVIDIA GB10 Grace Blackwell Superchips eine bemerkenswerte technische Entscheidung. Trotz seiner kompakten Bauweise HP spezifiziert eine vollständige thermische HülleUnter Volllast verbraucht das System je nach Konfiguration bis zu ca. 780 BTU/h. Die maximale Leistungsaufnahme beträgt ca. 228 W. HP wirbt zudem mit einem relativ niedrigen Geräuschpegel von 22 dBA im Leerlauf und 27.6 dBA unter Volllast.
Das Gerät misst ohne Füße 5.9 x 5.9 x 2.01 cm und zählt damit zu den ultrakompakten Geräten. HP weist ausdrücklich darauf hin, dass es nicht rackmontierbar ist, was seine Rolle als KI-Knoten für den Schreibtisch und nicht als Teil der herkömmlichen Rechenzentrumsinfrastruktur unterstreicht. Die Wartungsfreundlichkeit ist bewusst gering gehalten. Zum Zugriff auf die internen Komponenten wird ein Kreuzschlitzschraubendreher (Größe 1) benötigt, und die meisten Komponenten, einschließlich des Arbeitsspeichers, sind nicht vom Benutzer austauschbar.
Intern verwendet das ZGX Nano das Referenzboard-Design von NVIDIA, ebenso wie viele andere OEMs, die auf der DGX Spark-Plattform aufbauen. Der LPDDR5x-Speicher ist direkt auf die Platine gelötet und taktet mit bis zu 8533 MHz. Insgesamt priorisiert die Plattform Effizienz und Dichte gegenüber Modularität.
Sicherheit und Aufrüstbarkeit
HP hat den ZGX Nano G1n von Grund auf abgesichert. Er verfügt über ein integriertes TPM 2.0-Modul, das im FIPS 140-2-zertifizierten Modus arbeitet, die Spezifikationen der Trusted Computing Group erfüllt und Common Criteria EAL4+-zertifiziert ist. Zu den BIOS-basierten Schutzfunktionen gehören sichere Startsteuerung, PXE-basierte Remote-Boot-Funktionen und die Möglichkeit, das Booten von Wechselmedien vollständig zu deaktivieren.
Aus Hardware-Sicht stellt HP klar: Dieses System ist nicht aufrüstbar. Die 128 GB LPDDR5x-Speicher sind fest auf der Hauptplatine verlötet. Käufer müssen den Speicher zudem beim Kauf auswählen. Obwohl der einzelne M.2-Steckplatz elektrisch PCIe Gen5 x4 unterstützt, werden die Systeme ab Werk mit PCIe Gen4 x4 NVMe-SSDs ausgeliefert. Diese sind mit 2 TB oder 4 TB Speicherkapazität erhältlich und verfügen alle über selbstverschlüsselnde OPAL-Speicher.
HP weist darauf hin, dass Ersatzteile bis zu fünf Jahre nach Produktionsende verfügbar bleiben werden. Dennoch handelt es sich hierbei im Wesentlichen um ein System in Geräteform und nicht um eine modulare Workstation.
E/A und Erweiterung
Die Vorderseite des Geräts ist minimalistisch gestaltet und verfügt lediglich über einen Ein-/Ausschalter und eine Status-LED. Auf der Rückseite bietet das System eine Vielzahl leistungsstarker Anschlussmöglichkeiten. HP liefert die Stromversorgung über ein standardmäßiges, von NVIDIA empfohlenes 240-W-USB-C-Netzteil und weist darauf hin, dass Netzteile von Drittanbietern zu Leistungseinbußen oder Instabilität führen können.
Drei USB 3.2 Typ-C-Anschlüsse bieten USB-Konnektivität mit jeweils 20 Gbit/s und Unterstützung für DisplayPort 1.4a Alt Mode. Ein dedizierter HDMI 2.1a-Anschluss dient als zusätzliche Bildausgabe. Für die Netzwerkverbindung verfügt das System über einen Realtek RTL8127-CG 10GbE-Controller und einen NVIDIA ConnectX-7-Controller mit zwei 200GbE QSFP112-Ports, die jeweils eine Durchsatzrate von 200 Gbit/s bieten.
Der Netzwerk-Stack unterstützt eine Vielzahl von Enterprise-Funktionen. Dazu gehören PXE-Boot, Wake-on-LAN, VLAN-Tagging (802.1Q), Zeitsynchronisation (802.1as/1588) und Vollduplex-Betrieb über alle unterstützten Geschwindigkeiten. Zusätzlich bietet ein Wi-Fi-7-Modul (802.11be) 2×2 mit Bluetooth 5.4 drahtlose Konnektivität und unterstützt MU-MIMO, WPA3-Sicherheit sowie den Betrieb in den Frequenzbändern 2.4 GHz, 5 GHz und 6 GHz.
Grafik und Audio
Die integrierte NVIDIA Blackwell GPU im GB10 Superchip übernimmt alle Grafikaufgaben. Das System unterstützt 8K-Ausgabe mit 60 Hz über USB-C DisplayPort 1.4a und 8K mit 30 Hz über HDMI 2.1a. HP empfiehlt für die 8K-Ausgabe die Verwendung direkter Kabelverbindungen, da Adapter oder Dockingstationen zu Instabilität führen oder die Signalqualität beeinträchtigen können.
Die Audioausgabe erfolgt über HDMI, dedizierte analoge Audioausgänge sind nicht vorhanden. Dies entspricht der Positionierung des Systems als Rechenknoten und nicht als herkömmliche Multimedia-Workstation.
Thermische Prüfung
CPU Temperatur
Bei den CPU-Temperaturtests erreichte das HP ZGX Nano G1n während der intensivsten Lastspitzen eine Spitzentemperatur von 77.3 °C. Damit liegt HP bei Spitzentemperaturübergängen unterhalb der heißesten Systeme im Vergleich, deren Temperaturen in den Bereich von 90 °C stiegen. Beim Übergang zu gleichmäßiger ISL/OSL-Last und anschließend zu schwerer Dekodierung stabilisierten sich die CPU-Temperaturen, anstatt weiter stark anzusteigen.
Im unteren Lastbereich wurde bei geringer Auslastung eine minimale CPU-Temperatur von 36.4 °C gemessen. Dies bedeutet, dass das HP-System eine effektive Wärmeableitung aufweist, solange es keiner hohen Rechenlast ausgesetzt ist. Insgesamt zeigte das ZGX ein kontrolliertes, kurzzeitiges Wärmeverhalten der CPU mit stabiler Dauerlastleistung.
GPU-Temperatur
Die GPU-Temperaturen zeigten ein ähnliches Muster. Bei starker Beschleunigung erreichte die GPU eine maximale Temperatur von 69 °C. Damit liegt HP im Vergleich zu ähnlichen Systemen unter Spitzenlastbedingungen eher im unteren Bereich der kühleren Temperaturen, da einige andere Systeme (wie Dell, ASUS und die Founders Edition) im oberen Leistungsbereich deutlich wärmer liefen. Mit dem Übergang in die Phasen „Equal ISL/OSL“ und „Decode Heavy“ stabilisierten sich die GPU-Temperaturen.
Die GPU erreichte während der weniger intensiven Phasen eine minimale Temperatur von 34°C, was auf eine solide thermische Leistungsfähigkeit im Leerlauf hinweist.
NVMe-Temperatur
Während der Equal-Phase erreichte das NVMe-Laufwerk etwa 42 °C und zeigte damit nur einen allmählichen Anstieg gegenüber dem Ruhewert. Mit zunehmender Arbeitslast (Prefill Heavy) stieg die Speichertemperatur merklich auf 42 °C bis 47 °C. In der Decode-Heavy-Phase arbeitete das Laufwerk im wärmsten Bereich (47 °C bis 54 °C), wo es seinen Höchstwert erreichte, aber dennoch deutlich unter den meisten anderen Spark-Systemen blieb.
NIC-Temperatur
Während der Gleichlaufphase schwankte die NIC-Temperatur zwischen 39°C und 52°C und zeigte einen stetigen Anstieg, was auf eine moderate thermische Erwärmung hindeutet, da die Netzwerkaktivität zu Beginn des Laufs stark zunimmt.
Während der Prefill-Phase (Heavy) stieg die Temperatur der Netzwerkkarte (NIC) zwischen 48 °C und 64 °C an, da diese Phase das Netzwerk-Subsystem deutlich stärker und länger belastet. In der Decode-Phase (Heavy) erreichte die NIC-Temperatur mit 52 °C bis 68 °C ihren Höchstwert. Das thermische Verhalten blieb jedoch während des gesamten Tests stabil.
GPU-Leistungsaufnahme
Während der Gleichlastphase lag der Stromverbrauch der GPU zwischen 2.86 W und etwas über 40 W, womit sich der HP ZGX Nano G1n im Mittelfeld einordnete.
In der Phase „Prefill Heavy“ begann die GPU-Leistung bei etwa 37 W, sank bis auf 35 W und erreichte Spitzenwerte von bis zu 69 W, was diese Phase zur energieintensivsten des Testlaufs machte.
Während der Decode Heavy-Phase pendelte sich der Stromverbrauch der GPU in einem niedrigeren, stabileren Bereich von 35 W bis 46 W ein, was darauf hindeutet, dass der Strombedarf nachließ, als sich die Arbeitslast von dem aggressiveren Impulsverhalten entfernte.
Thermische Zusammenfassung
Unter Last arbeitet der ZGX Nano G1n innerhalb eines präzise kontrollierten Temperaturbereichs. Die maximale Leistungsaufnahme des Systems beträgt ca. 228 W, die Wärmeabgabe ca. 780 BTU/h. Im Leerlauf hingegen bleibt die Leistungsaufnahme mit ca. 36–38 W niedrig, was auf eine effiziente Leistungsskalierung im Ruhezustand hindeutet. Die Zwangsluftkühlung gewährleistet einen stabilen Betrieb innerhalb des von HP spezifizierten Temperaturbereichs von 5 °C bis 30 °C.
HP ZGX Nano AI Leistungstests
Zur Evaluierung des HP ZGX Nano mit GB10 testeten wir Spark-Einheiten mithilfe des vLLM Online Serving Benchmarks, der am weitesten verbreiteten Engine für Inferenz und Bereitstellung mit hohem Durchsatz für große Sprachmodelle. Der vLLM Online Serving Benchmark simuliert reale Produktionslasten, indem er gleichzeitig Anfragen an einen laufenden vLLM-Server sendet und wichtige Kennzahlen wie den gesamten Token-Durchsatz (Token pro Sekunde), die Zeit bis zum ersten Token und die Zeit pro ausgegebenem Token unter verschiedenen Lastbedingungen misst.
Unsere Tests umfassten verschiedene Modelle, darunter dichte Architekturen und mikroskalierte Datentypen, und bewerteten die Leistung anhand von drei Workload-Szenarien: Gleichmäßige ISL/OSL-Last, hohe Prefill-Last und hohe Dekodierungslast. Diese Szenarien repräsentieren unterschiedliche reale Serverlastmuster, von ausgewogenen Eingabe- und Ausgabelasten bis hin zu rechenintensiver Prompt-Verarbeitung und speicher- und bandbreitenbegrenzter Token-Generierung.
Zusätzlich zum HP ZGX Nano mit GB10 haben wir weitere OEM-Systeme von Dell, ASUS, Acer und GigabyteDadurch konnten wir die Ergebnisse von HP im breiteren Wettbewerbsumfeld einordnen und verstehen, wo das Unternehmen bei verschiedenen Modellen und Arbeitslasten führend ist, mit der Konkurrenz mithält oder hinterherhinkt.
GPT-OSS-120B
Mit GPT-OSS-120B erzielt der HP ZGX Nano G1n seine besten Ergebnisse im Prefill Heavy-Test, bei dem der Durchsatz von 304.5 tok/s in Batch 1 auf 2773.3 tok/s in Batch 64 steigt. Auch der ISL/OSL-Wert skaliert stetig und steigt im Verlauf des Tests von 69.6 tok/s auf 722.9 tok/s. Decode Heavy ist im Vergleich dazu deutlich weniger stark ausgeprägt: Der Durchsatz beginnt bei 183.7 tok/s in Batch 1, sinkt in Batch 2 leicht ab und erholt sich dann bis Batch 64 auf 262.9 tok/s.
GPT-OSS-20B
Bei GPT-OSS-20B erzielt HP die höchsten Werte im Prefill-Heavy-Modus, allerdings verläuft die Skalierung weniger linear als bei den anderen Modellen. Der Prefill-Wert beginnt bei Batch 1 mit 1626.6 tok/s, steigt bei Batch 2 auf 1980.3 tok/s, fällt bei Batch 4 rapide auf 1120.3 tok/s ab und erholt sich bis Batch 64 wieder auf 4345.1 tok/s. Der Wert für Equal ISL/OSL skaliert gleichmäßiger von 92.6 tok/s auf 1550.6 tok/s, und der Wert für Decode Heavy steigt von 94.4 tok/s auf 670.4 tok/s.
Qwen3 Coder 30B A3B FP8
Beim Qwen3 Coder 30B A3B (FP8) erzielt HP erneut hervorragende Ergebnisse im Bereich Prefill Heavy. Der Durchsatz steigt von 432.2 tok/s bei einer Batchgröße von 1 auf 2069.4 tok/s bei einer Batchgröße von 64. Die Geschwindigkeit bei gleichem ISL/OSL erhöht sich von 104.2 tok/s auf 1274.4 tok/s, während sich Decode Heavy von 55.9 tok/s auf 480.4 tok/s verbessert. Dies zählt zu den insgesamt besten Ergebnissen von HP.
Qwen3 Coder 30B A3B Base
Auf dem Qwen3 Coder 30B A3B (Base) verzeichnet HP in allen drei Phasen ein stetiges Wachstum, wobei der Spitzenwert weiterhin in der Prefill Heavy-Phase liegt. Diese Phase steigt von 258.6 tok/s bei Batch 1 auf 1629.4 tok/s bei Batch 64. Die ISL/OSL-Rate skaliert von 60.3 tok/s auf 690.3 tok/s, während die Decode Heavy-Rate von 33.0 tok/s auf 331.8 tok/s ansteigt.
Llama 3.1 8B Instruct FP4
Mit Llama-3.1-8B-Instruct (FP4) zeigt HP einen deutlichen Durchsatzanstieg. Die ISL/OSL-Rate steigt von 76.4 kT/s in Batch 1 auf 2774.1 kT/s in Batch 64 und ist damit die leistungsstärkste der drei HP-Phasen in diesem Modell. Auch die Prefill-Heavy-Rate skaliert stark und steigt von 316.8 kT/s auf 2397.1 kT/s in Batch 32, bevor sie in Batch 64 auf 2270.4 kT/s abfällt. Die Decode-Heavy-Rate steigt über den gesamten Durchlauf von 40.7 kT/s auf 547.6 kT/s.
Llama 3.1 8B Anleitung (Basis)
Auf Llama-3.1-8B-Instruct (Base) skaliert der HP ZGX Nano G1n in allen drei Phasen gleichmäßig. Im Equal ISL/OSL-Modus steigt der Durchsatz von 28.2 tok/s bei Batch 1 auf 1298.6 tok/s bei Batch 64. Im Prefill Heavy-Modus erhöht sich der Durchsatz von 123.2 tok/s auf 1759.5 tok/s, wobei die Steigerungen über den gesamten Bereich hinweg hoch bleiben und erst im oberen Bereich leicht abfallen. Im Decode Heavy-Modus ist der Durchsatz deutlich geringer und steigt von 15.5 tok/s bei Batch 1 auf 366.4 tok/s bei Batch 64.
GPU-Direktspeicher
So funktioniert GPU Direct Storage
Traditionell müssen Daten, die von einer NVMe-SSD stammen, zunächst die CPU und den Arbeitsspeicher durchlaufen, bevor sie die GPU erreichen. Dieser Prozess führt zu Engpässen, da die CPU als Vermittler fungiert, was Latenzzeiten verursacht und Systemressourcen verbraucht. GPU Direct Storage beseitigt diese Ineffizienz, indem es der GPU ermöglicht, direkt über den PCIe-Bus auf die Daten des Speichermediums zuzugreifen. Dieser direkte Pfad reduziert den Aufwand für die Datenübertragung und ermöglicht so schnellere und effizientere Übertragungen.
KI-Workloads, insbesondere solche mit Deep Learning, sind extrem datenintensiv. Das Training großer neuronaler Netze erfordert die Verarbeitung von Terabytes an Daten, und jede Verzögerung bei der Datenübertragung führt zu einer Unterauslastung der GPUs und längeren Trainingszeiten. GPU Direct Storage begegnet dieser Herausforderung, indem es Daten so schnell wie möglich an die GPU liefert, Leerlaufzeiten minimiert und die Recheneffizienz maximiert.
Darüber hinaus ist GDS vorteilhaft für Workloads, die große Datensätze streamen, wie z. B. Videoverarbeitung, Verarbeitung natürlicher Sprache und Echtzeit-Inferenz. Durch die Reduzierung der CPU-Auslastung beschleunigt GDS die Datenübertragung und stellt CPU-Ressourcen für andere Aufgaben bereit, wodurch die Gesamtleistung des Systems weiter verbessert wird.
GDSIO-Lesedurchsatz 16K
Betrachtet man den GDSIO-Lesedurchsatz (16K), so erreicht der HP ZGX Nano G1n mit einem Thread 0.70 GiB/s und zählt damit zu den leistungsstärkeren Systemen mit geringer Threadanzahl. Bei zwei Threads sinkt der Wert auf 0.41 GiB/s, steigt dann aber bei vier Threads wieder auf 0.86 GiB/s an. Dies zeigt die gleiche geringe Inkonsistenz zu Beginn der Thread-Nutzung, die bei einigen vergleichbaren Systemen beobachtet wurde. Ab diesem Punkt skaliert der Durchsatz deutlich gleichmäßiger. Er steigt auf 1.6 GiB/s bei acht Threads und 2.2 GiB/s bei 16 Threads, bevor er bei 32 Threads auf 3.0 GiB/s ansteigt. Auch bei höheren Warteschlangenlängen verbessert sich der HP kontinuierlich und erreicht 3.9 GiB/s bei 64 Threads und einen Spitzenwert von 4.6 GiB/s bei 128 Threads.
GDSIO-Lese-Durchschnittslatenz 16K
Betrachtet man die durchschnittliche Leselatenz (16K) von GDSIO, so beginnt diese beim HP ZGX Nano G1n mit einem Thread bei etwa 0.02 ms und bleibt auch bei zwei (0.08 ms) und vier Threads (0.07 ms) niedrig. Die Latenz steigt bei acht (0.08 ms) und 16 Threads (0.11 ms) leicht an und nimmt dann bei 32 (0.16 ms) und 64 Threads (0.25 ms) deutlich zu. Bei 128 Threads erreicht die Latenz 0.42 ms und liegt damit immer noch etwas unter den höchsten Werten der Vergleichsgruppe, wobei die stetige Skalierung des Systemdurchsatzes während des gesamten Tests erhalten bleibt.
GDSIO-Schreibdurchsatz 16K
Betrachtet man den GDSIO-Schreibdurchsatz von 16K, so beginnt der HP ZGX Nano G1n bei 0.84 GiB/s mit einem Thread, steigt auf 1.4 GiB/s mit zwei Threads und erreicht 2.2 GiB/s mit vier Threads. Die Leistung skaliert weiterhin stark mit acht Threads (3.0 GiB/s) und erreicht 3.3 GiB/s bei 16 Threads, wo sie sich dann stabilisiert. Ab diesem Punkt bleibt der Durchsatz mit 32 und 64 Threads nahezu konstant bei 3.3 GiB/s und sinkt dann leicht auf 3.2 GiB/s bei 128 Threads ab. Dies deutet darauf hin, dass die Plattform ihre maximale Schreibleistung relativ früh erreicht und dieses Niveau im weiteren Verlauf des Tests konstant beibehält.
GDSIO Schreiblatenz durchschnittlich 16K
Betrachtet man die durchschnittliche Schreiblatenz (16K) von GDSIO, so beginnt diese beim HP ZGX Nano G1n mit einem Thread bei etwa 0.02 ms und bleibt auch bei zwei (0.02 ms) und vier Threads (0.03 ms) sehr niedrig. Die Latenz steigt bei acht (0.04 ms) und 16 Threads (0.07 ms) leicht an, um dann bei 32 (0.15 ms) und 64 Threads (0.30 ms) sprunghaft anzusteigen. Bei 128 Threads erreicht die Latenz 0.61 ms und ist damit insgesamt noch recht gut kontrolliert. Der steigende Trend fällt jedoch mit dem Punkt zusammen, an dem der Schreibdurchsatz bei höheren Threadzahlen bereits stagniert.
GDSIO-Lesedurchsatz 1 Mio.
Betrachtet man den GDSIO-Lesedurchsatz von 1M, so erreicht der HP ZGX Nano G1n mit einem Thread 3.2 GiB/s und mit zwei Threads 4.1 GiB/s. Die Leistung steigt weiter mit vier Threads (5.2 GiB/s) und acht Threads (5.5 GiB/s), bevor die Plattform ihre maximale Leistung erreicht. Der Durchsatz bleibt dann bei 16, 32 und 64 Threads nahezu konstant bei 5.5 GiB/s, bevor er bei 128 Threads leicht auf 5.3 GiB/s abfällt. Dies deutet auf einen starken anfänglichen Anstieg hin, gefolgt von einem sehr stabilen Plateau bei hoher Thread-Anzahl.
GDSIO-Leselatenz durchschnittlich 1M
Betrachtet man die durchschnittliche Leselatenz (1M) von GDSIO, so beginnt diese beim HP ZGX Nano G1n mit einem Thread bei etwa 0.31 ms und bleibt auch bei zwei (0.47 ms) und vier Threads (0.76 ms) relativ niedrig. Die Latenz steigt mit zunehmender Anzahl paralleler Threads auf 1.4 ms bei acht Threads, 2.9 ms bei 16 Threads und 5.9 ms bei 32 Threads. Dieser Trend setzt sich bei 64 Threads (12.8 ms) fort und erreicht bei 128 Threads 27.2 ms. Damit folgt die Latenz den höheren Warteschlangenlängen, obwohl der Durchsatz bereits deutlich früher im Testverlauf seinen Höhepunkt erreicht hatte.
GDSIO-Schreibdurchsatz 1M
Betrachtet man den GDSIO-Schreibdurchsatz (1M), so erreicht der HP ZGX Nano G1n mit einem Thread einen Wert von 3.1 GiB/s, steigt mit zwei Threads auf 3.5 GiB/s und hält diesen Wert bei vier, acht und 16 Threads konstant. Bei 32 Threads sinkt die Leistung leicht auf 3.3 GiB/s, bevor sie bei 64 Threads wieder 3.5 GiB/s erreicht. Bei 128 Threads steigt der Durchsatz auf 3.7 GiB/s, was auf ein weitgehend gleichmäßiges Schreibprofil über den gesamten Bereich mit nur geringen Schwankungen und einem leichten Anstieg bei der höchsten Threadanzahl hindeutet.
GDSIO Schreibdurchschnittslatenz 1M
Betrachtet man die durchschnittliche Schreiblatenz (1M) von GDSIO, so beginnt diese beim HP ZGX Nano G1n bei etwa 0.31 ms mit einem Thread, steigt auf 0.57 ms mit zwei Threads und auf 1.1 ms mit vier Threads. Die Latenz nimmt mit steigender Anzahl gleichzeitiger Threads weiter zu und erreicht 2.2 ms bei acht Threads, 4.4 ms bei 16 Threads und 9.4 ms bei 32 Threads. Der Aufwärtstrend setzt sich bei 64 Threads (17.7 ms) fort und erreicht 37.3 ms bei 128 Threads. Dies spiegelt den stetig steigenden Warteschlangendruck wider, obwohl der Schreibdurchsatz selbst über den größten Teil des Messbereichs relativ konstant bleibt.
Fazit
HPs ZGX Nano G1n bietet das erwartete Leistungsprofil der DGX Spark-Plattform und zeichnet sich durch technische Besonderheiten aus, die ihn von anderen Spark-Systemen auf dem Markt abheben. In unseren Tests erreichten die CPU-Temperaturen maximal 77.3 °C und die GPU-Temperaturen 69 °C – beides relativ niedrige Werte im Vergleich zu anderen von uns getesteten Spark-Geräten. Die vLLM-Leistung war bei allen sechs getesteten Modellen unter Prefill-Heavy-Workloads am höchsten, wobei die Skalierung auch bei höheren Batchgrößen stabil blieb. Der Lesedurchsatz von GPU Direct Storage erreichte 4.6 GiB/s bei 16K- und 5.5 GiB/s bei 1M-Blockgrößen. Der Schreibdurchsatz erreichte zwar früh ein Plateau, blieb aber über alle verbleibenden Thread-Anzahlen hinweg konstant.
Der ZGX Nano G1n hebt sich von anderen Spark-Produkten durch die Arbeit von HP am Referenzdesign ab. Der Anteil an Recyclingmaterialien, die Aufteilung des Gehäuses in Ober- und Unterteil zur Verbesserung der internen Wartungsfreundlichkeit sowie der Geräuschpegel von 27.6 dBA unter Last zeugen von bewussten technischen Entscheidungen, die über die Anforderungen der GB10-Plattform hinausgehen. Auch die Sicherheitsarchitektur folgt diesem Muster. TPM 2.0 im FIPS 140-2-Modus, Common Criteria EAL4+ und SED OPAL-Speicher machen dieses Gerät zu einem System, das die Anforderungen regulierter Beschaffungsumgebungen erfüllt.
Wie andere Spark-Systeme ist auch dieses keine Allzweck-Workstation und wird von HP auch nicht als solche positioniert. Für Entwickler, kleine Teams und Organisationen, die lokale KI-Rechenleistung mit überzeugenden Nachhaltigkeits- und Sicherheitskonzepten benötigen, stellt die ZGX Nano G1n eine klar differenzierte Option innerhalb der Spark-Produktpalette dar. Für Unternehmen, für die diese Kriterien nicht relevant sind, ist die zugrundeliegende Plattform bei allen fünf von uns getesteten OEM-Systemen identisch, und die Entscheidung hängt letztendlich von Ökosystem, Support und Preis ab.








Amazon