Lenovo har länge varit ledande när det gäller att leverera lösningar för HPC-marknaden (High-Performance Computing). Lenovos vanliga erbjudanden är välkända av både slutanvändare och datacenteradministratörer, men Lenovos HPC-förmåga är kanske deras bäst bevarade hemlighet. Tja, hemligheten är såtillvida att den är den största leverantören av superdatorer globalt (32 % av dem enligt data som underhålls av Top 500).
Lenovo har länge varit ledande när det gäller att leverera lösningar för HPC-marknaden (High-Performance Computing). Lenovos vanliga erbjudanden är välkända av både slutanvändare och datacenteradministratörer, men Lenovos HPC-förmåga är kanske deras bäst bevarade hemlighet. Tja, hemligheten är såtillvida att den är den största leverantören av superdatorer globalt (32 % av dem enligt data som underhålls av Top 500).
Dessa enorma HPC-vinster drivs i grunden av Lenovos intima förståelse för HPC-området och viljan att ta chanser för att möta kundernas behov. Hur exakt översätts det risktagandet? Tja, för ungefär ett decennium sedan, Lenovo levererade en vätskekyld superdator till Leibniz Supercomputing Center i München, Tyskland. Det här evenemanget bidrog till att förändra ekonomin för superdatorer, särskilt på platser som Europa, där rackutrymme, kylning och kraft kommer i högsta grad.
Lenovo ThinkSystem SR670 V2
Även om mycket har förändrats inom superdatorer sedan dess, fortsätter Lenovo att förnya sig. Sommaren 2018 lanserade Lenovo officiellt Neptune, som visar upp sin vision för effektivare datacenter tack vare vätskekylning. Genom att lansera ThinkSystem SD650 på marknaden visade Lenovo för HPC-kunder hur enkelt det kunde vara att få vätskekylning till komponenter i en 1U-bricka som stöder 2x DWX (Neptune Direct Water Cooling)-noder per bricka. Upp till sex fack stöds i NeXtScale n1200-höljet (6U). Två år senare lanserade Lenovo SD650-N V2, vätskekylning, Ice Lake-processorer, sockelanslutna GPU:er, DRAM, lagrings- och I/O-moduler. Implementeringen av Liquid to Air (L2A) värmeväxlaren i ThinkSystem SR670 V2 är ett exempel på Lenovos framåtteknik.
Lenovo ThinkSystem SD650 V2 med Neptune™ vätskekylningsteknik
Vem behöver HPC-system egentligen?
Vem behöver all denna kraft egentligen med de rena prestandaförbättringarna i processorkraft, lagringsinnovationer och minne?
Företag av alla storlekar letar efter effektivare sätt att samla in och analysera data för att extrahera intelligens från flera olika resurser i nätverket. Särskilt företag fokuserade på datorintensiva program som molekylärbiologi, finans, spårning av globala klimatförändringar, snabb genanalys och seismisk avbildning. HPC får också uppmärksamhet från ett bredare fält av organisationer, som de företag som letar efter ett försprång på marknaden och som är villiga att investera i teknik som kommer att påverka produktivitet och tillväxt. HPC och AI, basen för de applikationer som nämnts tidigare, blir allt mer anpassade, vilket ger nya vägar för organisationer att dra nytta av denna data.
Behovet av omedelbar tillgång till aggregerad data fortsätter att driva efterfrågan på dessa HPC-system. Att ligga steget före konkurrenterna är absolut nödvändigt för en organisations framgång och livslängd. HPC är avgörande för att lösa komplexa problem för företag, vetenskap och teknik, och har blivit den underliggande grunden för innovationer inom vetenskap, forskning, detaljhandel, AV och mer och driver framsteg inom teknologier som påverkar samhället.
Den explosiva tillväxten av insamlad data från teknologier som AI & M/L, IoT, forskning och livestreamingtjänster kräver bearbetning i realtid, vilket är mer än vad en typisk server kan hantera.
En annan drivkraft bakom den ökade efterfrågan på HPC är att systemen kan distribueras vid kanten, i molnet eller på plats. Nyckeln är att bearbeta datan där denna data skapas och att inte behöva överföra den till en annan avlägsen plats för bearbetning.
Lenovo ThinkSystem SR670 v2 med L2A värmeväxlare
En kritisk faktor när du väljer en HPC-plattform är möjligheten att skala ut. När det kommer till massiva beräkningsresurser är mer bättre. Utskalningsmöjligheterna för dessa system är avgörande, och förmågan att skapa stora HPC-kluster kan innebära framgång eller misslyckande beroende på förmågan att skala. Att använda höghastighetssammankopplingar med låg latens och nyare lagringsteknik som NVMe kommer att påskynda beräkningsresultatet. Kluster kan byggas i ett datacenter, moln eller hybridmodell, vilket ger en flexibel och skalbar implementering. Lenovo ThinkSystem SR670 V2 är ett sådant system.
En GPU-rik server som uppfyller HPC-kraven
Lenovo ThinkSystem SR670 V2 är en GPU-rik 3U-rackserver som stöder åtta dubbelbredda GPU:er, inklusive NVIDIA A100 och A40 Tensor Core GPU:er, och en modell med NVIDIA HGX A100 4-GPU som erbjuds med NVLink och Lenovo Neptune hybrid liquid- kylning till luft. Servern är baserad på den nya tredje generationens Intel Xeon Scalable-processorfamilj (tidigare "Ice Lake") och den senaste Intel Optane Persistent Memory 200-serien.
SR670 V2 levererar optimal prestanda för artificiell intelligens (AI), High-Performance Computing (HPC) och grafiska arbetsbelastningar inom olika branscher. Detaljhandel, tillverkning, finansiella tjänster och hälsovårdsindustrier kan utnyttja processorkraften hos GPU:erna i SR670 V2 för att extrahera mer betydelsefulla insikter och driva innovation med hjälp av maskininlärning (ML) och djupinlärning (DL).
Traditionella luftkylningsmetoder når kritiska gränser. Ökning av komponentkraft, särskilt för CPU och GPU, har resulterat i högre energi- och infrastrukturkostnader, bullriga system och höga koldioxidavtryck. SR670 V2-modellen använder Lenovo Neptune vätske-till-luft (L2A) hybridkylningsteknik som bekämpar dessa utmaningar och avleder värme snabbt. Värmen från NVIDIA HGX A100 GPU:er avlägsnas genom en unik sluten slinga, vätske-till-luft värmeväxlare som ger fördelarna med vätskekylning såsom högre densitet, lägre strömförbrukning, tyst drift och högre prestanda utan att lägga till VVS.
Branscher utnyttjar GPU-teknik
SR670 V2 är byggd på två tredje generationens Intel Xeon Scalable-processorer designade för att stödja de senaste GPU:erna i NVIDIA Ampere-datacenterportföljen. SR3 V670 levererar arbetsbelastningsoptimerad prestanda, oavsett om du använder visualisering, rendering eller beräkningsintensiv HPC och AI.
Detaljhandel, tillverkning, finansiella tjänster och hälsovårdsindustrier utnyttjar GPU:er för att extrahera mer betydelsefulla insikter och driva innovation med hjälp av maskininlärning (ML) och djupinlärning (DL). Här är några sätt som accelererad datoranvändning utnyttjar GPU:er i olika organisationer:
- Fjärrvisualisering för team som arbetar hemifrån
- Strålspårad rendering för fotorealistisk grafik
- Kraftfull videokodning och avkodning
- In-silico-försök och immunologi inom biovetenskap
- Naturlig språkbehandling (NLP) för callcenter
- Automatisk optisk inspektion (AOI) för kvalitetskontroll
- Datorvision för detaljkundsupplevelse
När fler arbetsbelastningar utnyttjar acceleratorernas kapacitet ökar efterfrågan på GPU:er. ThinkSystem SR670 V2 levererar en optimerad företagslösning för att implementera accelererade HPC- och AI-arbetsbelastningar i produktionen, vilket maximerar systemets prestanda.
Flexibla konfigurationsalternativ
Den modulära designen ger ultimat flexibilitet i SR670 V2. Konfigurationsalternativ inkluderar:
- Upp till åtta dubbelbredds GPU:er med NVLink Bridge
- NVIDIA HGX™ A100 4-GPU med NVLink och Lenovo Neptune™ hybrid vätskekylning
- Välj mellan främre eller bakre höghastighetsnätverk
- Val av lokal höghastighetslagring på 2.5 tum, 3.5 tum och NVMe
ThinkSystem SR670 V2-prestandan är optimerad för din arbetsbelastning, visualisering, rendering eller beräkningsintensiva HPC och AI.
NVIDIA A100 Tensor Core GPU levererar oöverträffad acceleration – i alla skala – för att driva världens högst presterande elastiska datacenter för AI, dataanalys och HPC-applikationer. A100 kan effektivt skala upp eller delas upp i sju isolerade GPU-instanser. Multi-Instance GPU (MIG) tillhandahåller en enhetlig plattform som gör det möjligt för elastiska datacenter att dynamiskt anpassa sig till skiftande arbetsbelastningskrav. Ett rack med 13 ThinkSystem SR670 V2 kan generera upp till två PFLOPS datorkraft.
Byggd på den senaste Intel® Xeon® Scalable-familjens processorer och designad för att stödja avancerade GPU:er, inklusive NVIDIA Tesla V100 och T4, levererar ThinkSystem SR670 V2 optimerad accelererad prestanda för AI- och HPC-arbetsbelastningar.
Lösningar som skalar
Oavsett om man bara börjar med AI eller går in i produktion, måste lösningar skalas med organisationens behov. ThinkSystem SR670 V2 kan användas i en klustermiljö som använder höghastighetstyg för att skala ut när dina arbetsbelastningskrav ökar.
Aktiverad med Lenovo intelligent Computing Orchestration (LiCO), lägger den till stöd för flera användare och kommer att skalas inom en enda klustermiljö. LiCO är en kraftfull plattform som hanterar klusterresurser för HPC- och AI-applikationer.
LiCO tillhandahåller både AI- och HPC-arbetsflöden och stöder flera AI-ramverk, inklusive TensorFlow, Caffe, Neon och MXNet, och utnyttjar ett enda kluster för olika arbetsbelastningskrav.
Utvecklingen av innovation i hela HPC-portföljen har marscherat fram lika snabbt. För organisationer som inte riktigt är redo att ta steget till full vätskekylning, erbjuder ThinkSystem SR670 V2 imponerande flexibilitet.
Lenovo ThinkSystem SR670 V2 Konfigurerbarhet och specifikationer
Konfigurerbarhet är kärnan i ThinkSystem SR670 V2:s överklagande. Dess flexibilitet fokuserar på GPU-tät datoranvändning, och det mesta av dess fysiska volym är dedikerad till modulära GPU: er, antingen enkel- eller dubbelbredd eller NVIDIA SXM. De tre baskonfigurationerna är som följer.
Konfig 1 | Konfig 2 | Konfig 3 | |
Antal GPU:er | 4x SXM | 4x dubbelbred eller 8x enkelbred | 8x dubbel bred |
Drive Support | 8 x 2.5 tum | 8x 2.5 tum eller 4x 3.5 tum | 6x E1.S |
Konfigurationerna som visas:
Tabellen nedan visar de fullständiga SR670 V2-specifikationerna.
Komponenter | Specifikation |
Maskintyper | 7Z22 – 1 års garanti 7Z23 – 3 års garanti |
Formfaktor | 3U-rack |
Processorn | Två tredje generationens Intel Xeon Scalable-processorer (tidigare kodnamnet "Ice Lake"). Stöder processorer med upp till 40 kärnor, kärnhastigheter på upp till 3.6 GHz och TDP-värden på upp till 270W. |
chipset | Intel C621A "Lewisburg" chipset, en del av plattformen med kodnamnet "Whitley." |
Minne | 32 DIMM-platser med två processorer (16 DIMM-platser per processor). Varje processor har 8 minneskanaler, med 2 DIMM per kanal (DPC). Lenovo TruDDR4 RDIMM och 3DS RDIMM stöds. DIMM-platser delas mellan standardsystemminne och beständigt minne. DIMM:er fungerar på upp till 3200 MHz vid 2 DPC. |
Ihållande minne | Stöder upp till 16x Intel Optane Persistent Memory 200 Series-moduler (8 per processor) installerade i DIMM-kortplatserna. Persistent minne (Pmem) installeras i kombination med systemminne DIMM. |
Minnesmax | Med RDIMM:er: Upp till 4TB genom att använda 32x 128GB 3DS RDIMM Med beständigt minne: Upp till 4TB genom att använda 16x 128GB 3DS RDIMM och 16x 128GB Pmem-moduler (1.5TB per processor) |
Minnesskydd | ECC, SDDC (för x4-baserade minnes-DIMM), ADDDC (för x4-baserade minnes-DIMM:er, kräver Platinum- eller Gold-processorer) och minnesspegling. |
Diskenhetsfack | Antingen 2.5-tums, 3.5-tums eller EDSFF-enheter, beroende på konfigurationen:
Servern stöder även en intern M.2-adapter som stöder upp till två M.2-enheter. |
Maximal intern lagring |
|
Lagringskontroll |
|
Optiska enhetsfack | Ingen intern optisk enhet. |
Bandenhetsfack | Ingen intern backup-enhet. |
Nätverksgränssnitt | OCP 3.0 SFF-kortplats med flexibelt PCIe 4.0 x8- eller x16-värdgränssnitt, tillgängligt beroende på serverkonfigurationerna:
OCP-kortplatsen stöder en mängd olika 2-portars och 4-portsadaptrar med 1GbE, 10GbE och 25GbE nätverksanslutning. En port kan valfritt delas med XClarity Controller (XCC) hanteringsprocessor för Wake-on-LAN och NC-SI-stöd. |
PCI-expansionsplatser | Upp till 4x PCIe 4.0-platser, beroende på vald GPU och enhetsfack. Slotsvalet är från:
|
GPU-stöd | Stöder upp till 8x dubbelbredda PCIe GPU eller 4x SXM GPU, beroende på konfigurationen:
Obs: Konfigurationer med enkelbredda GPU:er som NVIDIA A10 kan vara möjliga via en särskild budförfrågan. |
Hamnar | Fram:
Bak:
Internt:
|
Kylning | 5x dubbelrotor enkelt utbytbara 80 mm fläktar, konfigurationsberoende. Fläktar är N+1 rotorredundanta, tolererar ett fel med en rotor. En fläkt är integrerad i varje strömförsörjning. |
Strömförsörjning | Upp till fyra hot-swap redundanta nätaggregat med 80 PLUS Platinum-certifiering. 1800 W eller 2400 W AC alternativ, stöder 220 V AC. Endast i Kina stöder strömförsörjning även 240 V DC.
|
Video | G200-grafik med 16 MB minne med 2D hårdvaruaccelerator, integrerad i XClarity Controller. Maximal upplösning är 1920×1200 32bpp vid 60Hz. |
Hot-swap delar | Drivsystem och nätaggregat. |
Systemhantering | Operatörspanel med statuslysdioder. På SXM- och 4-DW GPU-modeller, extern diagnostiklur med LCD-skärm (ej tillgänglig i 8-DW GPU-modeller). XClarity Controller (XCC) inbäddad hantering, XClarity Administrator centraliserad infrastrukturleverans, XClarity Integrator-plugins och XClarity Energy Manager centraliserad serverströmhantering. Valfri XClarity Controller Advanced och Enterprise för att aktivera fjärrkontrollfunktioner. |
Säkerhetsfunktioner | Chassiintrångsbrytare, startlösenord, administratörslösenord, Trusted Platform Module (TPM), stöder TPM 2.0. Endast i Kina, valfri Nationz TPM 2.0. |
Operativsystem stöds | Microsoft Windows Server, Red Hat Enterprise Linux, SUSE Linux Enterprise Server, VMware ESXi. |
Begränsad garanti | Tre år eller ett år (modellberoende) enhet som kan bytas av kund och begränsad garanti på plats med 9×5 nästa arbetsdag (NBD). |
Service och support | Valfria serviceuppgraderingar är tillgängliga via Lenovo Services: 4-timmars eller 2-timmars svarstid, 6-timmars fixtid, 1- eller 2-års garantiförlängning, mjukvarustöd för Lenovo-hårdvara och vissa tredjepartsprogram. |
Mått | Bredd: 448 mm (17.6 tum), höjd: 131 mm (5.2 tum), djup: 892 mm (35.1 tum). |
Vikt | Ungefärlig vikt, beroende på vald konfiguration:
|
GPU:er erbjuder betydande konfigurationsprestandaalternativ
GPU-stöd är den viktigaste variabeln mellan konfigurationer. Enkelbredda GPU:er använder PCIe x8-banor och skalar till NVIDIA A10, medan dubbelbredda GPU:er använder PCIe x16 och skalar till NVIDIA A100. Flaggskeppet SXM-konfigurationen använder NVIDIA HGX A100, som använder en NVIDIA NVLink-brygga (direkt GPU-till-GPU-kommunikation) för att ansluta sina fyra inbyggda GPU:er. Dubbelbredda GPU-konfigurationer stöder NVLink, och SR670 V2 stöder även den dubbelbredda AMD Instinct MI210.
HGX A100-plattformen är "Redstone"-varianten utan NVSwitch, med fyra SXM A100 GPU:er på ett enda kort. Både 40GB, 400-watt och 80GB, 500-watt-varianter är tillgängliga. Noterbart är att SR670 V2 använder Lenovos Neptune vätske-till-luft (L2A) hybridkylning med denna plattform för tystare, effektivare kylning och lägre strömförbrukning. En kall platta är monterad på varje GPU, genom vilken fyra redundanta lågtryckspumpar cirkulerar vätska. En stor enkel radiator leder bort värmen. Andra GPU-konfigurationer är endast luftkylda.
De individuella kylvätskepumparna ovanför varje GPU är synliga på den kalla plattan som en del av den Neptune-märkta delen. Dessa strömmar alla tillbaka genom den enda radiatorn för att hålla temperaturen i schack även under toppbelastningar.
Även om flytande kylning har uppenbara fördelar för att hålla temperaturen lägre, inser många inte hur stor prestandapåverkan som kan göra med GPU:s klockhastighet. När GPU:er är under hög belastning med luftkylning kan de nå maximala termiska designpunkter där de sedan måste strypa prestanda och sänka klockhastigheten för att hålla temperaturen i schack. Vätskekylning har inte det här problemet, vilket gör att GPU:erna kan köras hårdare och snabbare samtidigt som de bibehåller en konsekvent termisk profil under arbetsbelastningen.
Tabellen nedan visar skillnaden mellan en luftkyld och vätskekyld GPU under full belastning. När den luftkylda modellen börjar nå topptemperaturer sänks GPU-frekvensen, medan den vätskekylda CPU:n stannar på toppklockhastigheten under hela tiden.
För kortplatser har baskonfigurationerna SR670 V2 2x främre PCIe 4.0 x16 I/O-platser, även om resten av fronten är konfigurerbar för drivalternativen som nämns ovan. Alla stöder hot-swapping.
- SXM-modell – val av:
- 4x 2.5-tums hot-swap NVMe-enhetsfack
- 8x 2.5-tums hot-swap NVMe-enhetsfack
- 4-DW GPU-modell – val av:
- 8x 2.5-tums hot-swap AnyBay-enhetsfack som stöder SAS-, SATA- eller NVMe-enheter
- 4x 3.5-tums hot-swap-enhetsfack som stöder SATA-hårddiskar eller SSD-enheter (stöd för NVMe endast via specialbud)
- 8-DW GPU-modell:
- 6x EDSFF E1.S hot-swap NVMe-enhetsfack
SR670 V2 stöder också en eller två M.2-format SATA- eller NVMe-start- eller lagringsenheter. RAID-stöd erbjuds via en inbyggd hårdvarukontroller.
Under tiden är bakplanet fixat, med fyra PCIe 4.0 x16-platser och en OCP 3.0. SR670 V2:s fyra redundanta hot-swap-nätaggregat är också synliga bakifrån. De finns i alternativen 1800W eller 2400W och har 80 Plus Platinum-klassificeringar.
En annan strömförsörjningslänk ingår på SR670 V2-modeller utrustade med SXM-konfigurationen, som förser den främre GPU-sektionen med en dedikerad strömlänk. Dessa modeller står i skarp kontrast till de slot-load GPU-modeller, som inte inkluderar denna betydande kraftlänk från baksidan av chassit.
Resten av SR670 V2:s hårdvara är lika imponerande och fortsätter sitt flexibilitetstema. Den stöder upp till två 40-kärniga/80-trådiga Intel "Ice Lake" tredje generationens Xeon Scalable-processorer, med upp till en 270-watts TDP. Varje CPU har 16 DDR4-3200 RDIMM-platser; med 128 GB RDIMM, är minnestaket 4TB. Beroende på CPU stöder SR670 V2 även upp till 16 Intel Persistent Memory 200-serien, installerad med vanligt systemminne. Med all hårdvara som ThinkSystem SR670 V2 har att erbjuda, satte Lenovo sin bästa fot framåt på kyllayouten för att få ut mesta möjliga prestanda från systemet. Alla system tillåter inte alla komponenter att arbeta med 100 % utnyttjande utan strypning, medan SR670 V2 är designad för att möjliggöra just detta.
Avslutande tankar
Lenovo är engagerad i vätskekylning och har utnyttjat det kunnandet för att utveckla saker som L2A-värmeväxlaren. När strömtätheten fortsätter att öka inuti servrar måste leverantörer komma på kreativa metoder för att ta bort termisk belastning från komponenter och skicka ut den ur systemet. Alla kunder behöver eller vill inte ha kompletta lösningar för vätskekylning. Lenovo kan dock leverera lösningar för att möta kundernas kylbehov med luftkylda, delvis vattenkylda och helt vattenkylda servrar i sin portfölj.
Den första generationen av Neptune™ levererade flytande kylning till endast processorer och minne. Förutom CPU:er och minne har Lenovos Neptune Liquid Cooling-system utökats till att omfatta spänningsreglering, lagring, PCIe och nu GPU:er. Lenovo har till och med släppt en vätskekyld strömförsörjning som eliminerar fläktar. Med blicken mot framtiden ser Lenovo flytande kylning som nyckeln till att hantera värme som genereras av framtida generationer av CPU:er och GPU:er och sättet att bibehålla den densitet och fotavtryck som företagskunder har vant sig vid.
Den här rapporten är sponsrad av Lenovo. Alla åsikter och åsikter som uttrycks i denna rapport är baserade på vår opartiska syn på produkten/produkterna som övervägs.
Engagera dig med StorageReview
Nyhetsbrev | Youtube | Podcast iTunes/Spotify | Instagram | Twitter | Facebook | TikTok | Rssflöde