StorageReview.com

Plateforme de données IA hyperscale Cloudian : L’IA d’entreprise sans compromis

AI  ◇  Entreprise

Cloudian annonce la disponibilité générale de Cloudian HyperScale AI Data Platform, une solution clé en main parfaitement adaptée aux besoins de déploiement de l'IA en entreprise. Basée sur l'architecture de référence de la plateforme NVIDIA AI Data Platform, cette solution transforme des décennies de connaissances institutionnelles stockées dans des documents, des PDF, des images et des tableurs en informations instantanément accessibles via une interface intuitive de type chatbot. L'objectif est de permettre aux organisations de déployer des environnements d'IA conformes et prêts pour la production en quelques jours au lieu de plusieurs mois, tout en conservant une maîtrise totale de leurs données.

Résoudre le dilemme du déploiement de l'IA en entreprise

La plupart des programmes d'IA d'entreprise se heurtent à un problème récurrent. Pour gagner en rapidité, ils s'appuient souvent sur des environnements cloud partagés ou publics qui peuvent ne pas être conformes aux exigences internes en matière de sécurité, de souveraineté des données ou de réglementation. Afin de garder le contrôle, ils optent pour des solutions sur site personnalisées, impliquant de multiples fournisseurs, des mois d'intégration et des perspectives floues quant à l'obtention d'une valeur ajoutée mesurable pour l'entreprise.

Plateforme de données IA hyperscale Cloudian

Parallèlement, l'essentiel du savoir-faire des entreprises reste invisible aux systèmes d'IA. Cloudian cite le chiffre souvent avancé selon lequel environ 80 % du savoir institutionnel réside dans des contenus non structurés tels que des documents, des rapports, des courriels, des images et des journaux d'activité. Ces contenus s'étendent souvent sur plusieurs décennies et renferment des informations cruciales sur les processus, le contexte client et l'historique réglementaire. Faute de méthode pratique pour les ingérer et les interroger, les déploiements d'IA peinent à produire des résultats pertinents.

La plateforme de données IA HyperScale est conçue pour éliminer ce compromis. Elle regroupe la puissance de calcul, le stockage, le réseau et les logiciels au sein d'une infrastructure intégrée, opérationnelle en quelques jours et spécifiquement adaptée aux cas d'usage de l'IA documentaire en entreprise. Au lieu de nécessiter une migration de données importante ou une intégration complexe, le système est déployé sur site ou dans des environnements contrôlés, permettant ainsi aux organisations de conserver leurs données à leur emplacement actuel tout en les rendant accessibles aux charges de travail d'IA.

La plateforme intègre des solutions d'IA éprouvées de NVIDIA pour le traitement de documents en entreprise, fournissant des flux de travail de référence et des composants pré-validés pour le traitement de documents, la génération assistée par la recherche (RAG) et les tâches connexes. Cela réduit les risques par rapport aux projets sur mesure et garantit des déploiements basés sur des architectures reproductibles.

Justin Boitano, vice-président des produits d'IA d'entreprise chez NVIDIA, expose clairement ce besoin. Il souligne que la transformation des données d'entreprise en informations exploitables par l'IA exige bien plus qu'un simple stockage évolutif. Il ajoute qu'elle requiert une infrastructure hautement intégrée et performante, adaptable aux exigences de l'entreprise. Il cite la plateforme de données IA Cloudian HyperScale, basée sur l'infrastructure, le réseau et les logiciels d'IA de NVIDIA, comme une solution permettant aux organisations d'accéder en toute sécurité à des connaissances critiques, de simplifier la mise en œuvre et d'accroître leurs capacités d'IA au fur et à mesure de la croissance des volumes de données.

Impact commercial immédiat et rentabilité prévisible

La plateforme est conçue pour fournir des capacités d'IA d'entreprise sans les compromis traditionnels en termes de performances et de coûts qui ont caractérisé les premiers déploiements d'IA. Au niveau du stockage, Cloudian combine son stockage objet natif S3 avec l'accélération RDMA pour les opérations S3. Cette combinaison vise à éliminer les pertes de performance généralement associées au stockage objet dans les scénarios d'IA et de bases de données vectorielles sensibles à la latence.

Cloudian indique que ce S3 accéléré par RDMA offre des performances de base de données vectorielles jusqu'à 8 fois supérieures aux solutions basées sur le processeur et utilisant le stockage de fichiers traditionnel. Pour les clients, cela signifie que les opérations d'intégration, de recherche par similarité et de récupération peuvent garantir des réponses en temps réel pour des milliers d'utilisateurs simultanés, sans nécessiter de solutions de stockage sur mesure et non standard.

L'aspect économique est tout aussi crucial pour les équipes commerciales techniques et les architectes. En proposant la plateforme de données IA HyperScale sous forme d'appliance intégrée sur site, Cloudian aligne les dépenses d'infrastructure IA sur des investissements (CapEx) prévisibles plutôt que sur des dépenses d'exploitation (OpEx) cloud variables et souvent imprévisibles. La solution est conçue pour éliminer les dépenses courantes liées au cloud IA, telles que les frais d'inférence par jeton et les coûts élevés de stockage cloud, qui peuvent être considérablement supérieurs à ceux des déploiements sur site à haute densité.

Grâce à son architecture native S3 et à sa conception basée sur Cloudian HyperStore, la plateforme peut traiter et analyser des données provenant d'environnements sur site, d'architectures hybrides et de sites distribués. Cette flexibilité permet aux entreprises de conserver leurs données sur site tout en les intégrant à leurs flux de travail d'IA, sans avoir à effectuer une migration massive vers un cloud unique ou une plateforme propriétaire. Pour de nombreuses entreprises soumises à des réglementations, cette capacité est essentielle pour garantir la souveraineté des données et respecter les exigences de gouvernance interne.

IA de documentation d'entreprise

La plateforme de données d'IA HyperScale se concentre initialement sur l'IA documentaire d'entreprise. Son application intégrée d'IA documentaire est conçue pour exploiter des décennies de connaissances institutionnelles grâce à des requêtes conversationnelles en langage naturel. L'expérience utilisateur est volontairement similaire à celle des interfaces de messagerie instantanée grand public, mais s'appuie sur les documents et politiques propres à l'organisation.

Dans le secteur de la santé, par exemple, la plateforme permet d'interroger les dossiers patients, les protocoles cliniques et les directives internes, tout en respectant la loi HIPAA et les autres réglementations en matière de confidentialité. Les données ne quittant jamais l'environnement contrôlé de l'organisation, les équipes de conformité et d'audit conservent une visibilité complète sur le stockage et l'accès aux informations.

Dans le secteur financier, les institutions peuvent consulter les documents réglementaires, les politiques internes, les évaluations des risques et les bases de données contractuelles sans transmettre d'informations sensibles à des prestataires d'IA externes. Cette capacité à préserver la confidentialité des données réglementaires et clients tout en bénéficiant des avantages de la génération assistée par ordinateur est un argument de vente majeur pour les acheteurs soucieux de la gestion des risques.

D'un point de vue technique, ce modèle simplifie considérablement la complexité liée à la création de pipelines d'ingestion de documents, à l'indexation, à la vectorisation et aux flux de travail de recherche. Au lieu de concevoir cette architecture de A à Z, les clients s'appuient sur le modèle de référence intégré à la plateforme et se concentrent sur l'optimisation, le contrôle d'accès et la gouvernance.

Au-delà des documents : vidéo et analyses

Cloudian positionne sa plateforme de données IA HyperScale comme un socle capable de prendre en charge de multiples applications d'IA au fil du temps, et pas seulement les cas d'utilisation axés sur les documents. Sa feuille de route prévoit notamment la prise en charge de l'analyse vidéo, en particulier dans des environnements tels que les usines, les entrepôts, les plateformes logistiques et les chantiers de construction, où l'intelligence vidéo en temps réel ou quasi réel peut améliorer la sécurité, la qualité et l'efficacité opérationnelle.

Les prochains projets se concentreront sur l'analyse des flux vidéo pour la détection d'activités et d'anomalies, ainsi que sur la surveillance opérationnelle, grâce à une infrastructure intégrée unique. Les applications futures incluront également des analyses de données plus poussées et des fonctionnalités d'IA d'entreprise supplémentaires, le tout via une seule et même plateforme matérielle et logicielle. Cette approche unifiée simplifie l'acquisition et la gestion du cycle de vie, car les clients n'ont plus besoin de déployer de solutions ponctuelles distinctes pour chaque nouvelle charge de travail d'IA.

Architecture de la plateforme et fondements matériels

La configuration d'entrée de gamme de la plateforme de données HyperScale AI repose sur l'architecture de référence NVIDIA RTX PRO Server. Ce système est conçu pour les charges de travail d'IA et peut être configuré avec jusqu'à huit GPU NVIDIA RTX PRO 6000 Blackwell Server Edition, offrant une accélération considérable pour l'entraînement, le réglage fin et l'inférence sur de grands ensembles de données non structurées.

La puissance de calcul est assurée par deux processeurs Intel Xeon série 6900, garantissant une capacité de traitement général suffisante pour l'orchestration, le prétraitement des données et les services du plan de contrôle. La plateforme intègre également des DPU NVIDIA BlueField-3, capables de décharger les processeurs hôtes des tâches de réseau, de sécurité et de stockage, ainsi que des SuperNIC Ethernet NVIDIA Spectrum-X, offrant une connectivité à haut débit et faible latence, essentielle pour l'IA et les charges de travail gourmandes en données.

Côté stockage, la plateforme utilise Cloudian HyperStore avec des supports NVMe pour offrir un stockage objet compatible S3 à haut débit et faible latence. L'intégration de RDMA pour la connectivité S3 réduit la surcharge du protocole et permet aux charges de travail d'IA et vectorielles d'accéder aux données objet avec une latence plus proche de celle des systèmes de fichiers ou de blocs locaux, tout en conservant les avantages de scalabilité du stockage objet.

L'architecture est conçue pour une mise à l'échelle fluide, des téraoctets aux exaoctets, au fur et à mesure de l'augmentation des besoins en données. Cette capacité d'évolution est essentielle pour les clients souhaitant débuter par des projets d'IA de portée limitée, tout en bénéficiant d'une perspective claire de déploiement global sans avoir à repenser leur infrastructure.

Michael Tso, PDG de Cloudian, souligne que les entreprises ont besoin de plateformes d'IA qui s'intègrent à leurs cadres de sécurité et de conformité existants, plutôt que de contraindre ces cadres à s'adapter. Il précise qu'HyperScale AI offre un accès sécurisé au savoir institutionnel via une interface de chatbot intuitive, tout en préservant la maîtrise des données et en réduisant le délai de déploiement de plusieurs mois à quelques jours.

Disponibilité

La plateforme de données IA HyperScale de Cloudian est disponible immédiatement dans le monde entier via l'écosystème de partenaires certifiés de Cloudian.

Chaque système inclut le support Cloudian HyperCare, qui fournit des services de gestion à distance et une assistance technique 24h/24 et 7j/7.

S'engager avec StorageReview

Inscrivez-vous à notre infolettre |  YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | Flux RSS

Harold Fritt

Je suis dans l'industrie de la technologie depuis qu'IBM a créé Selectric. Ma formation, cependant, est l'écriture. J'ai donc décidé de sortir de l'avant-vente et de revenir à mes racines, en écrivant un peu mais en restant impliqué dans la technologie.