Accueil EntrepriseAI IBM dévoile l'architecture du processeur Telum II et de l'accélérateur IBM Spyre

IBM dévoile l'architecture du processeur Telum II et de l'accélérateur IBM Spyre

by Harold Fritt

IBM dévoile l'architecture Telum II et Spyre Accelerator au Hot Chips 2024.

IBM a dévoilé les détails de l'architecture de ses prochains processeurs IBM Telum II et IBM Spyre Accelerator lors de la conférence Hot Chips 2024. Ces nouvelles technologies sont conçues pour augmenter considérablement la capacité de traitement des systèmes mainframe IBM Z de nouvelle génération, permettant l'accélération des modèles d'IA traditionnels et des modèles d'IA à grands langages grâce à une nouvelle méthode d'ensemble de l'IA. Alors que de nombreux projets d'IA générative exploitant les modèles à grands langages (LLM) passent de la preuve de concept à la production, la demande des entreprises pour des solutions économes en énergie, sécurisées et évolutives est devenue une priorité absolue.

Selon une étude de Morgan Stanley, les besoins en énergie de l'IA générative devraient augmenter de 75 % par an au cours des prochaines années, les projections indiquant que la consommation énergétique de l'IA pourrait égaler celle de l'Espagne d'ici 2026. Cela a poussé les clients d'IBM à donner la priorité aux décisions architecturales qui prennent en charge des modèles de fondation de taille appropriée et des approches hybrides par conception pour les charges de travail de l'IA.

Le processeur IBM Telum II est conçu pour alimenter la prochaine génération de systèmes IBM Z. Il présente une fréquence accrue, une capacité de mémoire étendue, une augmentation de 40 % du cache et un cœur accélérateur d'IA intégré. Le nouveau processeur introduit une unité de traitement de données (DPU) connectée de manière cohérente, conçue pour accélérer les protocoles d'E/S complexes pour la mise en réseau et le stockage sur le mainframe. La DPU simplifie les opérations du système et améliore les performances des principaux composants, ce qui rend le processeur Telum II parfaitement adapté aux solutions informatiques d'entreprise prenant en charge les LLM et les besoins transactionnels complexes du secteur.

Le processeur Telum II est complété par l'accélérateur IBM Spyre, qui offre des capacités de calcul IA supplémentaires. Ensemble, les puces Telum II et Spyre forment une architecture évolutive qui prend en charge les méthodes d'ensemble de modélisation IA, en combinant plusieurs modèles d'IA d'apprentissage automatique ou d'apprentissage profond avec des LLM d'encodeur. Cette approche d'ensemble exploite les points forts de chaque architecture de modèle pour fournir des résultats plus précis et plus robustes par rapport aux modèles individuels. L'accélérateur IBM Spyre, présenté en avant-première lors du Hot Chips 2024, sera disponible en option complémentaire. Il est connecté via un adaptateur PCIe de 75 watts et est évolutif pour s'adapter aux besoins des clients.

Tina Tarquinio, vice-présidente de la gestion des produits pour IBM Z et LinuxONE, a souligné l'engagement d'IBM à rester en avance sur les tendances technologiques, en particulier sur les exigences croissantes de l'IA. Elle a déclaré que le processeur Telum II et l'accélérateur Spyre sont conçus pour fournir des solutions informatiques d'entreprise hautes performances, sécurisées et économes en énergie. Ces innovations, qui ont nécessité des années de développement, seront introduites dans la plateforme IBM Z de nouvelle génération d'IBM, permettant aux clients de tirer parti des LLM et de l'IA générative à grande échelle.

Le processeur Telum II et l'accélérateur IBM Spyre seront fabriqués par Samsung Foundry, partenaire de longue date d'IBM, à l'aide de son nœud de processus 5 nm à hautes performances et à faible consommation d'énergie. Ensemble, ces technologies prendront en charge une gamme de cas d'utilisation avancés basés sur l'IA, conçus pour libérer de la valeur commerciale et créer de nouveaux avantages concurrentiels. Par exemple, une détection améliorée des fraudes dans les demandes d'indemnisation d'assurance habitation peut être obtenue grâce à des modèles d'IA d'ensemble qui combinent les LLM avec les réseaux neuronaux traditionnels. En outre, la détection avancée des activités financières suspectes peut contribuer à soutenir la conformité aux exigences réglementaires et à atténuer le risque de délits économiques. Dans le même temps, les assistants d'IA peuvent accélérer les cycles de vie des applications, transférer des connaissances et fournir des explications et des transformations de code.

Le processeur Telum II devrait être doté de huit cœurs hautes performances cadencés à 5.5 GHz, avec 36 Mo de cache L2 par cœur et une augmentation de 40 % de la capacité de cache sur puce, soit un total de 360 ​​Mo. Le cache virtuel de niveau 4 offrira 2.88 Go par tiroir de processeur, soit une augmentation de 40 % par rapport à la génération précédente. L'accélérateur d'IA intégré permet une inférence d'IA en transaction à faible latence et à haut débit, offrant une multiplication par quatre de la capacité de calcul par puce par rapport à la génération précédente. De plus, la nouvelle unité d'accélération d'E/S DPU, intégrée à la puce Telum II, est conçue pour améliorer la gestion des données avec une augmentation de 50 % de la densité d'E/S, améliorant ainsi l'efficacité et l'évolutivité globales de l'IBM Z pour les charges de travail d'IA à grande échelle et les applications gourmandes en données.

L'accélérateur IBM Spyre est un accélérateur d'entreprise spécialement conçu pour gérer des modèles d'IA complexes et des cas d'utilisation d'IA générative. Il dispose d'une mémoire allant jusqu'à 1 To, répartie sur huit cartes dans un tiroir d'E/S standard, prenant en charge les charges de travail des modèles d'IA sur l'ensemble du mainframe tout en ne consommant pas plus de 75 W par carte. Chaque puce dispose de 32 cœurs de calcul prenant en charge les types de données int4, int8, fp8 et fp16, ce qui permet des applications d'IA à faible latence et à haut débit.

Le processeur Telum II équipera les plateformes IBM Z et IBM LinuxONE de nouvelle génération d'IBM et sera disponible en 2025. L'IBM Spyre Accelerator, actuellement en avant-première technique, devrait être disponible en 2025.

S'engager avec StorageReview

Newsletter |  YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | Flux RSS