Broadcom a annoncé la sortie de VMware Cloud Foundation 9.1, positionnant sa plateforme comme une infrastructure de cloud privé optimisée pour les charges de travail d'IA en production. Cette version met l'accent sur une intégration plus poussée de l'IA et de Kubernetes, une prise en charge matérielle étendue (AMD, Intel et NVIDIA) et des fonctionnalités de sécurité intégrées conçues pour les déploiements d'IA en entreprise. Cette mise à jour s'adresse aux organisations exécutant des applications d'inférence et des applications d'IA agentielle émergentes, en privilégiant la maîtrise des coûts, la flexibilité de l'infrastructure et la gouvernance des données.
Radius Tech a compilé les données de Private Cloud Outlook 2026 en partenariat avec Broadcom. Cette enquête mondiale a été menée auprès de 1 800 décideurs informatiques au sein d’entreprises.
L'entreprise a également partagé les premiers résultats de son rapport à venir « Perspectives du cloud privé 2026 », qui indiquent une tendance continue vers le cloud privé pour l'IA en production. Selon les données préliminaires, 56 % des organisations exécutent ou prévoient d'exécuter des charges de travail d'inférence dans des environnements privés, contre 41 % dans le cloud public, soit un recul par rapport à l'année précédente. Les coûts restent un facteur déterminant, 62 % des responsables informatiques citant les coûts d'infrastructure de l'IA générative comme un problème majeur. Par ailleurs, 36 % font état de nouvelles exigences en matière de protection des données, de confidentialité et de gestion des risques, induites par l'adoption de l'IA.
Krish Prasad, vice-président senior et directeur général de la division VMware Cloud Foundation chez Broadcom, a souligné trois défis majeurs auxquels les entreprises sont confrontées lors de l'adoption de l'IA : les problématiques de confidentialité des données et de la propriété intellectuelle, la hausse des coûts d'infrastructure et la préparation à l'IA agentielle. Il a insisté sur le fait que VCF 9.1 offre une plateforme unifiée qui répond à ces enjeux en fournissant une infrastructure avancée pour l'IA privée, en permettant une sécurité de type « zéro confiance », en optimisant les coûts grâce à des choix d'infrastructure intelligents et en prenant en charge à la fois les flux de travail agentiels et l'inférence accélérée sur une plateforme unique.
Efficacité des coûts et des infrastructures
VCF 9.1 introduit plusieurs optimisations d'infrastructure pour améliorer l'efficacité des ressources pour les charges de travail mixtes combinant IA et méthodes traditionnelles. Broadcom annonce une réduction des coûts serveur pouvant atteindre 40 % grâce à une hiérarchisation intelligente de la mémoire, permettant une densité de charge de travail plus élevée sans matériel supplémentaire. L'efficacité du stockage est également améliorée grâce à des techniques de compression et de déduplication optimisées dans les pipelines de données IA, réduisant le coût total de possession (TCO) jusqu'à 39 %.
L'exploitation de Kubernetes constitue un autre axe de développement majeur. La plateforme est conçue pour réduire les coûts opérationnels jusqu'à 38 %, tout en améliorant l'évolutivité et la vitesse de déploiement. Broadcom souligne également des améliorations opérationnelles, notamment des mises à niveau de clusters quatre fois plus rapides et un doublement de la capacité des parcs de serveurs, permettant ainsi aux entreprises de faire évoluer plus rapidement leur infrastructure d'IA dans des environnements distribués.
Plateforme unifiée pour charges de travail mixtes
VCF 9.1 poursuit la stratégie de VMware visant à proposer un modèle d'infrastructure unifié prenant en charge les machines virtuelles, les conteneurs et les charges de travail d'IA sur une même plateforme. Il inclut la prise en charge de l'inférence accélérée par GPU et des flux de travail multi-agents gourmands en ressources CPU, répondant ainsi au besoin croissant d'équilibrer les exigences de calcul hétérogènes.
La plateforme étend les capacités de Kubernetes en offrant une plus grande capacité de cluster, des délais de déploiement plus courts et des fenêtres de mise à niveau réduites par rapport aux versions précédentes. Ces améliorations visent à prendre en charge les services d'IA de production qui exigent une disponibilité continue et une interruption de service minimale.
Les outils opérationnels ont également été améliorés grâce à de nouvelles fonctionnalités d'observabilité fournissant des indicateurs tels que le délai d'obtention du premier jeton, le débit de jetons et l'utilisation du GPU sur différents types d'accélérateurs. Ceci permet un réglage plus précis des performances et une planification de la capacité plus fine. De plus, des modèles d'application réutilisables permettent aux équipes de standardiser les déploiements multi-VM et conteneurisés, réduisant ainsi les écarts de configuration entre les environnements.
Flexibilité matérielle et intégration à l'écosystème
Broadcom met l'accent sur la prise en charge d'un écosystème ouvert dans VCF 9.1, avec une compatibilité multi-GPU couvrant les GPU AMD et NVIDIA, ainsi que la prise en charge des CPU AMD et Intel. La plateforme s'intègre également aux technologies réseau standard telles que EVPN et VXLAN, et assure l'interopérabilité avec Arista Universal Cloud Network.
Cette approche permet aux entreprises de combiner et d'adapter le matériel en fonction des exigences de charge de travail et de la disponibilité, un facteur important compte tenu des contraintes d'approvisionnement actuelles sur le marché des GPU.
Automatisation et opérations évolutives
L'automatisation est au cœur de cette version. VCF 9.1 étend les capacités de gestion de parc pour prendre en charge jusqu'à 5 000 hôtes et inclut des opérations de cycle de vie automatisées qui réduisent les interventions manuelles. Les mises à niveau des clusters sont considérablement accélérées, avec la prise en charge des environnements distribués et isolés du réseau.
La mutualisation est également améliorée, permettant l'isolation des charges de travail d'IA entre équipes ou clients tout en maintenant une utilisation optimale des ressources GPU et CPU partagées. Ceci est particulièrement pertinent pour les fournisseurs de services et les grandes entreprises qui consolident leur infrastructure d'IA.
La plateforme réduit davantage la dépendance aux équipements externes en intégrant des services de virtualisation de l'équilibrage de charge et de sécurité via VMware AVI Load Balancer et vDefend. Ceci contribue à réduire les dépenses d'investissement tout en préservant la résilience des applications et l'automatisation de leur cycle de vie.
Architecture de sécurité intégrée et de confiance zéro
La sécurité est intégrée à l'infrastructure VCF 9.1, avec un accent particulier sur la protection des modèles d'IA, des données d'entraînement et des pipelines d'inférence. La plateforme met en œuvre une segmentation Zero Trust pour l'ensemble des charges de travail, y compris les environnements Kubernetes, et introduit une détection et une prévention des intrusions distribuées avec une inspection à haut débit.
Les nouvelles fonctionnalités de récupération après une attaque de ransomware offrent des environnements de récupération isolés et des outils de validation, et s'intègrent à la solution de sécurité des terminaux CrowdStrike Falcon. Cette approche vise à protéger les actifs d'IA de grande valeur tout en maintenant les données localisées afin de répondre aux exigences de souveraineté.
Les fonctionnalités de conformité continue automatisent la surveillance et la correction conformément aux politiques définies, permettant aux organisations de rester prêtes pour les audits sans outils supplémentaires. Les correctifs en direct réduisent davantage le risque opérationnel en permettant des mises à jour sans interruption de service dans la plupart des cas d'utilisation, assurant ainsi la disponibilité permanente des services d'IA.
Notre avis : Forte évolution de la plateforme, mais pas destination par défaut pour l’IA
VMware Cloud Foundation 9.1 représente une évolution logique pour Broadcom, notamment dans sa volonté de repositionner VMware comme une plateforme viable pour l'IA d'entreprise. L'accent mis sur le cloud privé, la sécurité intégrée et l'unification des opérations sur les machines virtuelles, les conteneurs et les GPU répond aux attentes de nombreuses grandes organisations qui rapprochent leurs charges de travail d'inférence de leurs données.
La complexité du sujet réside dans le déploiement actuel des infrastructures d'IA. Les pipelines d'IA distribuées modernes s'appuient sur des architectures centrées sur Kubernetes, avec des conceptions d'infrastructure de plus en plus modulaires privilégiant la flexibilité et l'accès direct à la puissance de calcul accélérée. Dans ces environnements, VMware ne constitue généralement pas la couche de contrôle et, dans de nombreux cas, devient une couche supplémentaire plutôt que la base.
Le coût est un autre facteur difficile à ignorer. Broadcom présente VCF 9.1 comme une solution pour réduire les dépenses d'infrastructure grâce à des gains d'efficacité, mais cet argument se heurte aux préoccupations persistantes des entreprises clientes concernant les licences VMware et le coût total de possession. Cette tension est particulièrement visible dans les petites structures, où les équipes qui pourraient bénéficier d'une plateforme plus intégrée sont souvent les plus sensibles aux changements de licences et à la dépendance vis-à-vis d'une plateforme. Les grandes entreprises, en revanche, sont plus enclines à absorber ces coûts et à investir dans une expertise Kubernetes dédiée pour concevoir et exploiter une infrastructure d'IA à grande échelle.
VCF 9.1 conserve tout son intérêt. Les entreprises ayant déjà investi massivement dans VMware, notamment celles qui privilégient la gouvernance des données, la cohérence opérationnelle et l'infrastructure privée, pourraient trouver cette approche particulièrement pertinente pour l'inférence et les services d'IA en phase de démarrage. Toutefois, pour les déploiements d'IA entièrement nouveaux ou les équipes évoluant au rythme des frameworks d'IA actuels, la solution de choix reste l'architecture Kubernetes native et l'infrastructure conçue spécifiquement pour les charges de travail d'IA distribuées.
Le résultat tient moins à ce que VMware devienne la référence en matière d'IA d'entreprise, qu'à ce que VMware s'assure de rester pertinent à mesure que les charges de travail d'IA commencent à s'intégrer au sein des entreprises.




Amazon