Att para ihop vätskekylning och effektiv SSD-hantering erbjuder en väg framåt för datacenter som vill skala prestanda och lagringstäthet.
Eftersom datacenter strävar efter större energieffektivitet, särskilt med kraven på AI-arbetsbelastningar, vänder sig många till flytande kylning för att optimera prestanda och hantera energiförbrukningen. Vätskekylning kan effektivt hantera värmen som genereras av högpresterande servrar, vilket gör att de kan arbeta med toppkapacitet utan de energikrävande kostnader som är förknippade med traditionell luftkylning. Solidigms SSD:er med hög densitet är idealiska för dessa miljöer och erbjuder exceptionell effektivitet från terabyte-till-watt.
Medan AI tvingar många datacenteroperatörer att överväga vätskekylning, når dess inverkan mycket längre. I en tidigare rapport undersökte vi effekten av vätskekylning på en 2U Dell PowerEdge R760. CoolITs direkta vätskekylning (DLC) reducerade serverns energiförbrukning avsevärt genom att sänka fläkthastigheterna, en strömbesparing på 200 watt. Det testet var helt centrerat på CPU-prestanda; den här gången ville vi ta en mer lagringscentrerad look för att förstå effekten av SSD-enheter på serverns strömförbrukning.
Vad är NVMe Active Power States?
NVMe-effekttillstånd är fördefinierade tillstånd som en NVMe-enhet kan övergå till för att hantera strömförbrukning och prestanda. NVMe-specifikationen tillåter upp till 32 strömtillstånd, var och en kännetecknad av maximal strömförbrukning, ingångslatens (ENLAT), utgångslatens (EXLAT) och relativa prestandavärden. Dessa makttillstånd är uppdelade i operationella och icke-operativa tillstånd. Driftseffekttillstånd, eller P-tillstånd, tillåter enheten att hantera I/O-operationer. Icke-operativa tillstånd, eller F-tillstånd, används när enheten är inaktiv och inte hanterar I/O-operationer.
Att hantera dessa strömtillstånd är avgörande för att optimera strömeffektiviteten för NVMe-enheter, särskilt i miljöer där strömförbrukningen är ett kritiskt problem, såsom edge-enheter och specialiserade applikationer som SSD:erna på den internationella rymdstationen. Till exempel innehåller NVMe-specifikationen funktioner som Autonomous Power State Transition (APST), som gör att enheten automatiskt kan växla mellan effekttillstånd baserat på aktuell användning och termiska förhållanden. Detta hjälper till att balansera prestanda med strömförbrukning, vilket säkerställer tillförlitlig drift i avlägsna eller begränsade miljöer. Stöd för Runtime D3 (RTD3) gör att enheten går in i ett nollläge i viloläge, vilket ytterligare sparar energi när enheten inte används.
NVMe-strömtillstånd är särskilt fördelaktiga när energieffektivitet och termisk hantering är av största vikt. I edge-enheter, till exempel, kan förmågan att snabbt gå över till lägre strömtillstånd när de är inaktiva avsevärt minska energiförbrukningen, vilket är avgörande för enheter som arbetar i avlägsna eller tuffa miljöer med begränsad strömtillgång. Detta uppnås genom funktioner som PCIe Active State Power Management (ASPM) och lågeffekttillstånd som L1.1 och L1.2, som minskar strömförbrukningen till minimala nivåer. Att hantera kraft och värmeeffekt på ISS är avgörande på grund av den begränsade och kontrollerade miljön. NVMe-strömtillstånd kan hjälpa till att strypa strömförbrukningen för SSD:er för att hantera termisk designkraft (TDP) och optimera den övergripande energibudgeten, vilket säkerställer att SSD:erna fungerar effektivt utan överhettning.
I dessa specialiserade miljöer ger NVMe-strömtillstånd ett flexibelt och effektivt sätt att hantera strömförbrukningen för NVMe-enheter. Genom att utnyttja dessa tillstånd kan enheter balansera prestanda och energieffektivitet, vilket gör dem lämpliga för olika applikationer, från edge computing till rymduppdrag. Möjligheten att dynamiskt justera effekttillstånd baserat på realtidsförhållanden säkerställer att NVMe-enheter kan möta de varierande kraven från olika miljöer samtidigt som de optimerar för energieffektivitet och värmehantering.
Förutom NVMe-strömtillstånd spelar konceptet Composite Temperature och Touch Temperature en avgörande roll för att hantera den termiska prestandan hos NVMe SSD:er i nya företags SSD:er. Touch Temperature representerar den externa höljestemperaturen på SSD:n. Solidigm har varit ledande när det gäller att ta till sig nya högre beröringstemperaturstandarder. Den fabriksinställda Touch Temperature för Solidigm D5-P5336 är till exempel 80°C. Denna högre beröringstemperaturgräns gör att SSD:er kan kylas med lägre luftflöde eller att fungera i högre omgivningstemperaturer. Denna flexibilitet gör det möjligt för datacenter att optimera kylningsstrategier och förbättra den övergripande värmehanteringen, vilket potentiellt kan minska kylkostnaderna och förbättra tillförlitligheten och livslängden för SSD:erna.
Hantera NVMe Active Power-tillstånd
I en Linux-testmiljö som kör Ubuntu 22.04 kan vi använda NVMe-verktygsuppsättningen för att polla enheten för att se och ändra D5-P5336:s strömtillstånd. Som du kan se nedan stöder frekvensomriktaren tillstånd 0,1 och 2, där steg 0 är det minst restriktiva och steg 2 är det mest restriktiva.
För Solidigm 61.44 TB D5-P5336 är PS0 25W, PS1 är 15W och PS2 är 10W. Enheten går på tomgång på cirka 5.5 W, så med varje höjning av strömläget har SSD:n mindre och mindre kraftkostnader att dedikera till NAND-läs- och skrivoperationer. Skrivoperationer tar den största träffen, eftersom den använder mer kraft för att skriva till NAND än för att läsa från den.
Kommandot för att kontrollera det aktuella strömtillståndet på vår Solidigm D5-P5336 SSD visas nedan. Det aktuella värdet på 00000000 indikerar att frekvensomriktaren är i PS0, vilket är det högsta 25W-läget.
Ett liknande kommando utfärdas för att ändra strömtillståndet, där det slutliga numret representerar det strömläge du vill att SSD:n ska vara i. Följande kommando ställer till exempel in strömläget till PS0 på Soldigim D5-P5336 SSD. Om du använder effektläge 1 eller 2, ändra siffran —-värde= så att den motsvarar rätt effektläge.
Inverkan av makttillstånd på prestanda
För att mäta effektpåverkan och prestandapåverkan av effekttillstånd på Solidigm D5-P5336 61.44TB SSD, utrustade vi en Dell PowerEdge R760 med 24 SSD:er. Genom att köra Ubuntu och FIO-arbetsbelastningsgeneratorn kan vi enkelt köra en konsekvent arbetsbelastning över alla SSD:er och uppdatera strömläget i farten.
Vi använde Dells inbyggda strömövervakning i serverns iDRAC9 inbyggda hanteringssystem för att övervaka strömmen på systemnivå.
Vi fokuserade på sekventiell läs- och skrivbandbreddsarbetsbelastning, med en blockstorlek på 128K över varje enhet, och mätte sedan sammanlagd prestanda över alla 24 SSD:er. Det bör noteras att just denna Dell PowerEdge R760-konfiguration med 24 NVMe-fack utnyttjar en PCIe-switch jämfört med direktanslutna NVMe-fack. Så den totala uppmätta bandbredden mättar de tillgängliga PCIe-switchbanorna innan den träffar enheterna. Detta påverkar den totala läsprestandan vi mätte jämfört med Soldigim P5536-specifikationen, men de sammanlagda skrivhastigheterna var alla under den gränsen.
Totalt watt | skriv~~POS=TRUNC | Läs GB/s | Watt Över Base |
Watt/drivning (med systemoverhead) |
|
---|---|---|---|---|---|
Tomgång Inga enheter | 462 | - | - | - | - |
Inaktiva enheter installerade | 594 | - | - | 132 | 5.5 |
24x sekventiell läsning PS0 | 858 | - | 109GB / s | 396 | 16.5 |
24x sekventiell läsning PS1 | 858 | - | 105GB / s | 396 | 16.5 |
24x sekventiell läsning PS2 | 759 | - | 79.8GB / s | 297 | 12.375 |
24x Sequential Write PS0 | 1089 | 82.5GB / s | - | 627 | 26.125 |
24x Sequential Write PS1 | 825 | 34.4GB / s | - | 363 | 15.125 |
24x Sequential Write PS2 | 726 | 17.3GB / s | - | 264 | 11 |
När vi tittar tillbaka på vår artikel om fördelarna med att konvertera en luftkyld plattform till direkt vätskekylning, såg vi en liten prestandaökning när det gäller processorerna, men vi sparade också 200W ström. Ström är en dyrbar vara i den nya vågen av AI-centrerade servrar som ofta dedikerar alla tillgängliga resurser till GPU:er och avancerade processorer. I ett datacenter vid eller nära en energibudgetgräns för luftkylning, köper byte till DLC en energibudget som gör att servern kan fyllas med fler SSD:er för samma effektavtryck som en luftkyld server.
En energibesparing på 200W kan räcka långt när det gäller lagringstäthet; Med dessa besparingar kan du fördubbla lagringsutrymmet från 12 till 24 SSD-enheter på en vätskekyld server jämfört med en luftkyld server om du har arbetsbelastningar inriktade på läsintensiva arbetsbelastningar. Med Solidigm D5-P5336 har denna server med 24 fack ökat lagringskapaciteten från 737 TB till 1,474 24 TB tack vare vätskeslingan. Om arbetsbelastningen är skrivtung skulle du kunna utrusta servern med cirka åtta fler SSD:er. Dessa siffror är dock med baskraftlägena, så om du är villig att raka lite skrivprestanda från den övre änden, kan du enkelt packa din server med XNUMX SSD: er med en skrivtung arbetsbelastning med minskad prestanda.
Slutsats
Genom våra tester av Solidigm D5-P5336 SSD:er har vi sett hur hantering av NVMe-strömtillstånd kan påverka energieffektiviteten avsevärt utan att det påverkar prestandan dramatiskt. Datacenteroperatörer som vill maximera energieffektiviteten kan utnyttja dessa effekttillstånd för att uppnå större lagringstäthet eller minska driftskostnaderna, särskilt i AI-centrerade miljöer där strömmen är i högsta grad. Solidigms SSD:er med hög densitet är väl positionerade för detta och erbjuder utmärkt effektivitet från terabyte till watt, särskilt med modern vätskekylningsteknik.
Våra resultat visar att även små justeringar av strömtillstånd kan ge betydande energibesparingar, vilket kan vara avgörande i miljöer som begränsas av strömtillgänglighet. Att optimera servrarnas totala strömförbrukning ökar lagringstätheten och stöder mer hållbar datacenterdrift.
Strömhantering blir allt mer kritisk när moderna servrar pressas till sina gränser, särskilt i AI-drivna arbetsbelastningar. Att para ihop vätskekylning och effektiva SSD-hanteringsalternativ erbjuder en väg framåt för datacenter som vill skala prestanda och lagringstäthet utan att överskrida energibudgetar.
Du kan se hela demon av dessa teknologier live på OCP 2024. Vi kommer att visa upp hur flytande kylning och Solidigms SSD:er kan vara hörnstenarna för energieffektivitet i det moderna datacentret.
Denna rapport är sponsrad av Solidigm. Alla åsikter och åsikter som uttrycks i denna rapport är baserade på vår opartiska syn på produkten/de produkter som övervägs.
Engagera dig med StorageReview
Nyhetsbrev | Youtube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | Rssflöde