IBM hat bahnbrechende Forschungen in der Optiktechnologie angekündigt, die die Art und Weise revolutionieren sollen, wie Rechenzentren generative KI-Modelle trainieren und ausführen. Das Unternehmen hat einen neuartigen Ansatz für Co-Packaged Optics (CPO) entwickelt – eine Technologie der nächsten Generation, die lichtbasierte Konnektivität in Rechenzentren nutzt. Durch die Entwicklung und Montage des ersten öffentlich angekündigten Polymer-Lichtwellenleiters (PWG), der diese Innovation vorantreibt, wollen IBM-Forscher die Übertragung von Daten mit hoher Bandbreite zwischen Chips, Leiterplatten und Servern neu definieren.
Bild mit freundlicher Genehmigung von Ranovus
Glasfasertechnologie transportiert riesige Datenmengen über weite Distanzen und ermöglicht so den weltweiten Handel und die Kommunikation. In Rechenzentren sind Racks für die Konnektivität jedoch auf kupferbasierte DAC-Netzwerkkabel angewiesen. IBM ist der Ansicht, dass diese Konfiguration zu Engpässen führen kann, da sie Geschwindigkeit und Kapazität begrenzt und GPU-Beschleuniger während verteilter KI-Trainingsprozesse längere Zeit im Leerlauf bleiben. IBMs Durchbruch zielt darauf ab, die Geschwindigkeit und Effizienz optischer Technologien in diese internen Verbindungen zu bringen und so Leistung und Energieeffizienz drastisch zu verbessern.
IBM hat einen neuen CPO-Prototypmodul vorgestellt, der Hochgeschwindigkeits-Glasfaserverbindungen in Rechenzentren ermöglicht. Die in einem Artikel auf arXiv veröffentlichte Studie zeigt, wie diese Technologie die Bandbreite drastisch erhöhen, GPU-Ausfallzeiten reduzieren und das Training von KI-Modellen beschleunigen kann, während gleichzeitig der steigende Energiebedarf in Rechenzentren gedeckt wird.
Hauptvorteile von Co-Packaged Optics (CPO)
Verbesserte Energieeffizienz und Kostensenkung
Die CPO-Technologie ermöglicht eine mehr als fünffache Reduzierung des Energieverbrauchs im Vergleich zu elektrischen Verbindungen mittlerer Reichweite. Dank dieser Weiterentwicklung können Datenzentrums-Verbindungskabel von nur wenigen Metern auf Hunderte von Metern verlängert werden, was die Betriebskosten erheblich senkt.
- Beschleunigtes KI-Training: Durch den Ersatz herkömmlicher elektrischer Leitungen durch optische Verbindungen kann CPO die Trainingsgeschwindigkeit großer Sprachmodelle (LLMs) um das bis zu Fünffache erhöhen. So kann die Trainingszeit für ein LLM beispielsweise von drei Monaten auf drei Wochen reduziert werden, wobei die Leistungssteigerungen bei der Skalierung von Modellen und GPU-Ressourcen noch größer ausfallen.
- Beispiellose Energieeinsparungen: IBM schätzt, dass jedes mit CPO trainierte KI-Modell das Äquivalent des jährlicher Stromverbrauch von 5,000 US-Haushalten, und unterstreicht die transformative Wirkung auf die Energieeffizienz.
- Unübertroffene Bandbreitendichte: CPO-Module bieten bis zu 80-mal mehr Bandbreite zwischen Chips im Vergleich zu elektrischen Verbindungen. Die Innovation von IBM ermöglicht es Chipherstellern, sechsmal mehr Glasfasern am Rand von Silizium-Photonik-Chips hinzuzufügen, was als „Beachfront-Dichte“ bezeichnet wird, wodurch die Gesamtkapazität des Rechenzentrums verbessert wird.
Bahnbrechende Polymer-Lichtwellenleiter-Technologie (PWG)
Das Forschungsteam von IBM hat ein hochdichtes PWG mit optischen Kanälen im Abstand von 50 Mikrometern entwickelt, die adiabatisch mit Silizium-Photonik-Wellenleitern gekoppelt sind. Diese Baugruppe, die mit Standardverpackungsprozessen hergestellt wurde, ist die erste, die strenge Fertigungsbelastungstests bestanden hat, darunter hohe Luftfeuchtigkeit, extreme Temperaturen von -40 °C bis 125 °C und mechanische Haltbarkeit. Das Stapeln von PWGs ermöglicht bis zu 128 Verbindungskanäle und bietet eine beispiellose Skalierbarkeit.
Diese Innovation steht im Einklang mit IBMs Führungsposition in der Halbleitertechnologie und baut auf Fortschritten wie dem ersten 2-nm-Knotenchip, Nanosheet-Transistoren und vertikalen Transistoren (VTFET) auf. Die CPO-Technologie bietet eine neue Möglichkeit, den steigenden Anforderungen der KI gerecht zu werden, indem sie die Kommunikation außerhalb des Moduls von elektrisch auf optisch umstellt und einen nachhaltigen und skalierbaren Rechenzentrumsbetrieb ermöglicht.
Unterstützung des generativen KI-Wachstums
Dario Gil, Senior Vice President und Forschungsleiter bei IBM, hob das transformative Potenzial von CPO hervor:
„Da generative KI mehr Energie und Rechenleistung erfordert, müssen sich die Rechenzentren weiterentwickeln – und gemeinsam verpackte Optiken können diese Rechenzentren zukunftssicher machen. Mit diesem Durchbruch werden die Chips von morgen ähnlich kommunizieren, wie Glasfaserkabel Daten in und aus Rechenzentren transportieren. Damit wird eine neue Ära schnellerer, nachhaltigerer Kommunikation eingeläutet, die die KI-Arbeitslasten der Zukunft bewältigen kann.“
Die Arbeit von IBM an CPO wurde in Albany, New York, durchgeführt, wo sich das kürzlich eröffnete National Semiconductor Technology Center (NSTC) befindet. Die Prototypenmontage und Modultests fanden in IBMs Einrichtung in Bromont, Quebec, statt, einem führenden Unternehmen im Bereich Chip-Verpackungen. Diese Zusammenarbeit ist Teil der Initiative Northeast Semiconductor Corridor, deren Ziel darin besteht, die Halbleiterinnovation in den Vereinigten Staaten und Kanada zu stärken.
Die Co-Packaged-Optics-Innovation von IBM stellt einen bedeutenden Fortschritt bei der Weiterentwicklung der Datencenter-Kommunikation dar. Durch die Integration von Lichtgeschwindigkeitsverbindungen in Racks verspricht die CPO-Technologie beispiellose Effizienz, Bandbreite und Energieeinsparungen, definiert die Fähigkeiten von Datencentern neu und bereitet sie auf die wachsenden Anforderungen der generativen KI und darüber hinaus vor.




Amazon