Home EnterpriseAI Van SLI tot NVLink: de evolutie van gaming- en multi-GPU-technologieën en hun invloed op AI

Van SLI tot NVLink: de evolutie van gaming- en multi-GPU-technologieën en hun invloed op AI

by Jordaan Ranous
HP Z8 Fury G5 CPU-koeler

Het landschap van grafische verwerkingseenheden (GPU’s) heeft de afgelopen twintig jaar seismische verschuivingen ondergaan, veel recenter met de opkomst van AI. Een belangrijk onderdeel van deze evolutie was de ontwikkeling van technologieën waarmee meerdere GPU's achter elkaar kunnen werken. NVIDIA, een koploper op het gebied van GPU's, loopt voorop in deze revolutie met twee cruciale technologieën: Scalable Link Interface (SLI) en NVIDIA NVLink. Dit artikel beschrijft de reis van SLI naar NVLink en benadrukt hoe NVIDIA zich voortdurend aanpast aan de steeds veranderende computervereisten.

Het landschap van grafische verwerkingseenheden (GPU’s) heeft de afgelopen twintig jaar seismische verschuivingen ondergaan, veel recenter met de opkomst van AI. Een belangrijk onderdeel van deze evolutie was de ontwikkeling van technologieën waarmee meerdere GPU's achter elkaar kunnen werken. NVIDIA, een koploper op het gebied van GPU's, loopt voorop in deze revolutie met twee cruciale technologieën: Scalable Link Interface (SLI) en NVIDIA NVLink. Dit artikel beschrijft de reis van SLI naar NVLink en benadrukt hoe NVIDIA zich voortdurend aanpast aan de steeds veranderende computervereisten.

De dageraad van SLI

NVIDIA introduceerde begin jaren 2000 SLI, oorspronkelijk ontwikkeld door 3dfx voor de Voodoo2-kaartlijn, en was NVIDIA's antwoord op de groeiende vraag naar hogere grafische betrouwbaarheid in videogames en consumententoepassingen. In de kern gebruikt SLI een techniek die bekend staat als Alternate Frame Rendering (AFR) om de renderingwerklast over meerdere GPU's te verdelen. Elke kaart zou elk ander frame of zelfs een deel van elk frame tekenen, waardoor de grafische kracht effectief zou worden verdubbeld. Hoewel SLI destijds revolutionair was, had het beperkingen, waaronder een hogere latentie en een gebrek aan flexibiliteit bij het delen van gegevens tussen GPU's.

SLI versus CrossFire: een rivaliteit in multi-GPU-oplossingen

Hoewel NVIDIA's SLI de toon zette voor configuraties met meerdere GPU's, was dit niet zonder concurrentie. AMD's CrossFire was een directe concurrent en bood vergelijkbare mogelijkheden voor multi-GPU-opstellingen. Net als SLI wilde CrossFire de grafische prestaties verbeteren door middel van technieken als Alternate Frame Rendering (AFR) en Split Frame Rendering (SFR).

Beeldcredits Dallas Moore

Beeldcredits Dallas Moore

CrossFire had echter zijn eigen voordelen en uitdagingen. Het was over het algemeen flexibeler met de combinaties van GPU's die konden worden gebruikt, waardoor een mix van verschillende AMD-kaarten mogelijk was. Het nadeel was dat CrossFire vaak werd bekritiseerd vanwege de softwarestack, die sommige gebruikers minder betrouwbaar en complexer vonden om te configureren dan NVIDIA's SLI. Ondanks deze verschillen waren beide technologieën gericht op hetzelfde doel: het verbeteren van gaming- en grafische consumentenervaringen. Hun beperkingen bij het uitvoeren van meer geavanceerde, data-intensieve taken zouden uiteindelijk de weg vrijmaken voor oplossingen van de volgende generatie, zoals NVLink.

Naarmate de jaren 2010 aanbraken, begon het computerlandschap dramatisch te veranderen. De opkomst van kunstmatige intelligentie (AI), high-performance computing (HPC) en big data-analyse maakte robuustere multi-GPU-oplossingen noodzakelijk. Het werd duidelijk dat SLI, aanvankelijk ontworpen met het oog op gaming en consumentenwerklasten, onvoldoende was voor deze rekenintensieve taken. NVIDIA had een nieuw paradigma nodig.

Het tijdperk van dual-GPU-kaarten: een unieke benadering van multi-GPU-computing

Terwijl technologieën als SLI en CrossFire zich concentreerden op het verbinden van meerdere afzonderlijke GPU's, was er een andere, minder gebruikelijke benadering van multi-GPU-configuraties: dual-GPU-kaarten. Deze gespecialiseerde grafische kaarten bevatten twee GPU-kernen op een enkele PCB (Printed Circuit Board), die feitelijk fungeerden als een SLI- of CrossFire-opstelling op een enkele kaart. Kaarten zoals de NVIDIA GeForce GTX 690 en de AMD Radeon HD 6990 waren populaire voorbeelden van deze aanpak.

Dual-GPU-kaarten bieden verschillende voordelen. Ze bespaarden ruimte door twee GPU's in één kaartsleuf te condenseren, waardoor ze aantrekkelijk werden voor pc's met een kleine vormfactor. Ze vereenvoudigden ook de installatie door de noodzaak te elimineren om afzonderlijke kaarten aan externe connectoren te koppelen. Deze kaarten waren echter niet zonder problemen. Warmteafvoer was een groot probleem, waarvoor vaak geavanceerde koeloplossingen nodig waren. Het stroomverbruik was ook hoog, waardoor krachtige stroomvoorzieningen nodig waren om het systeem te stabiliseren.

Interessant genoeg waren dual-GPU-kaarten een soort ‘beste-van-twee-werelden’-oplossing, waarbij de brute kracht van multi-GPU-opstellingen werd gecombineerd met de eenvoud van een enkele kaart. Toch werden ze vaak gezien als een nicheproduct vanwege de hoge kosten en de daarmee samenhangende technische uitdagingen. Naarmate multi-GPU-technologieën zoals NVLink zijn geëvolueerd om hogere bandbreedte en lagere latentie te bieden, is de behoefte aan dual-GPU-kaarten afgenomen. Toch blijven ze een fascinerend hoofdstuk in de geschiedenis van GPU-ontwikkeling.

De Tesla-lijn van GPU's van NVIDIA was een hoeksteen in computergebruik op ondernemingsniveau, vooral in datacenters en krachtige computerclusters. Hoewel de meeste Tesla GPU's kaarten met één GPU zijn die zijn ontworpen voor maximale prestaties en efficiëntie, zijn er uitzonderingen geweest, zoals de Tesla K80, die dubbele GPU's op één kaart heeft. Deze multi-GPU Tesla-kaarten zijn geoptimaliseerd voor zeer parallelle berekeningen en waren een belangrijk onderdeel van wetenschappelijk onderzoek, machinaal leren en big data-analyse. Ze zijn ontworpen om aan de specifieke eisen van deze toepassingen te voldoen en bieden een hoge rekencapaciteit, grote geheugencapaciteiten en geavanceerde functies zoals Error-Correcting Code (ECC)-geheugen. Hoewel ze minder vaak voorkomen dan hun tegenhangers met één GPU, vormden deze Tesla-kaarten met dubbele GPU een krachtige, zij het niche-oplossing in bedrijfscomputers.

De komst van NVLink

Maak kennis met NVLink, geïntroduceerd met NVIDIA's Volta-architectuur in 2017. Deze technologie was niet alleen een upgrade, maar een fundamentele heroverweging van hoe GPU's met elkaar konden worden verbonden. NVLink bood een aanzienlijk hogere bandbreedte (tot 900 GB/s met de nieuwste versies), lagere latentie en een mesh-topologie die ingewikkeldere en talrijkere verbindingen tussen GPU's mogelijk maakte. Bovendien introduceerde NVLink het concept van unified memory, waardoor geheugenpooling tussen aangesloten GPU's mogelijk wordt gemaakt, een cruciale functie voor taken waarvoor grote datasets nodig zijn.

Evolutie van NVLink-prestaties

Evolutie van NVLink-prestaties

SLI versus NVLink

Op het eerste gezicht zou je NVLink kunnen zien als “SLI op steroïden”, maar dat zou een te grote vereenvoudiging zijn. Hoewel beide technologieën erop gericht zijn meerdere GPU's te koppelen, is NVLink ontworpen met een ander publiek in gedachten. Het is gemaakt voor wetenschappelijk onderzoek, data-analyse en vooral AI- en machine learning-toepassingen. De hogere bandbreedte, lagere latentie en het uniforme geheugen maken NVLink tot een veel flexibelere en krachtigere oplossing voor de huidige computeruitdagingen.

Technische ruggengraat van NVLink

NVLink vertegenwoordigt een logische evolutie in multi-GPU-interconnecttechnologie, niet alleen in termen van snelheid maar ook in architectonisch ontwerp. Het weefsel van NVLink bestaat uit snelle datalanen die gegevens bidirectioneel kunnen overbrengen. In tegenstelling tot traditionele busgebaseerde systemen maakt NVLink gebruik van een point-to-point-verbinding, waardoor knelpunten effectief worden verminderd en de gegevensdoorvoer wordt verbeterd. De meest recente iteraties bieden bandbreedtes tot 900 GB/s, een aanzienlijke verbetering ten opzichte van de mogelijkheden van SLI.

HP Z8 Fury G5 interieur

HP Z8 Fury G5 met 4x A6000 GPU's

Een van de belangrijkste kenmerken waarmee NVLink zich onderscheidt, is de mogelijkheid om een ​​mesh-topologie te ondersteunen. In tegenstelling tot de in serie geschakelde of hub-and-spoke-topologieën van oudere technologieën, zorgt een mesh-opstelling voor meer veelzijdige en talrijke verbindingen tussen GPU's. Dit is met name handig in datacenters en krachtige computertoepassingen waar complexe dataroutes de norm zijn.

Uniform geheugen is een ander kenmerk van NVLink. Hierdoor kunnen GPU's een gemeenschappelijke geheugenpool delen, waardoor gegevens efficiënter kunnen worden gedeeld en de noodzaak om gegevens tussen GPU's te kopiëren wordt verminderd. Dit is een enorme impuls voor toepassingen als machine learning en big data-analyse, waarbij grote datasets vaak de geheugencapaciteit van een enkele GPU overschrijden.

NVLink verbetert ook de latentie, een cruciale factor in elke krachtige computeropstelling. Een lagere latentie zorgt voor een snellere gegevensoverdracht en synchronisatie tussen GPU's, wat leidt tot efficiëntere parallelle berekeningen. Dit wordt bereikt door de directe geheugentoegang (DMA)-mogelijkheden van NVLink, waardoor GPU's rechtstreeks naar elkaars geheugen kunnen lezen en schrijven zonder tussenkomst van de CPU.

De impact op AI en machine learning

Gezien het toenemende belang van AI in modern computergebruik zijn de voordelen van NVLink niet alleen incrementeel, maar ook transformatief. Bij AI-modeltraining en gegevenscreatie maakt NVLink snellere gegevensoverdracht tussen GPU's mogelijk, waardoor efficiëntere parallelle verwerking mogelijk is. Dit is vooral gunstig bij het werken met grote trainingsdatasets, een onderwerp dat nauw aansluit bij het opkomende veld van AI-modeltrainingsgegevenscreatie.

Met de groeiende eisen van geavanceerde computers, zoals kwantumsimulaties, realtime analyses en AI-algoritmen van de volgende generatie, kunnen we verdere verbeteringen in de mogelijkheden van NVLink verwachten. Of het nu gaat om een ​​toename van de bandbreedte of nieuwe functies die een nog betere samenwerking tussen GPU's mogelijk maken, NVLink of zijn opvolger zal ongetwijfeld centraal blijven staan ​​bij het vervullen van de computerbehoeften van morgen.

De transitie van SLI naar NVLink markeert een belangrijke mijlpaal voor multi-GPU-technologieën. Het weerspiegelt de toewijding van NVIDIA aan innovatie en een scherp begrip van het veranderende computerlandschap. Van gaming tot AI, consumententoepassingen tot datacenters: de wortels van NVLink in gaming en SLI illustreren hoe noodzaak innovatie voortbrengt en technologie vooruit stuwt in een eindeloze cyclus van verbetering.

Neem contact op met StorageReview 

Nieuwsbrief | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS Feed