Pure Storage présente FlashBlade//EXA, une plate-forme de stockage IA et HPC hautes performances offrant une vitesse de lecture de plus de 10 To/s à grande échelle.
Pure Storage a présenté FlashBlade//EXA, présentée comme la plateforme de stockage de données la plus performante du secteur, conçue pour gérer les charges de travail les plus exigeantes en matière d'IA et de calcul haute performance (HPC). Cette nouvelle offre, basée sur l'architecture FlashBlade éprouvée, élimine les goulots d'étranglement des métadonnées qui ont historiquement limité le potentiel de l'IA. Conçue pour une concurrence élevée et capable de gérer les demandes de métadonnées étendues typiques de l'IA et du HPC à grande échelle, FlashBlade//EXA devrait fournir plus de 10 téraoctets par seconde de performances de lecture dans un seul espace de noms, établissant ainsi une nouvelle norme de performances.
L'architecture fondamentale de FlashBlade//EXA permet de faire évoluer les données et les métadonnées de manière indépendante. Les entreprises peuvent atteindre une expansion quasi illimitée et des performances multidimensionnelles en utilisant des nœuds de données tiers facilement disponibles. De plus, sa dépendance aux protocoles standard et aux normes de mise en réseau simplifie les processus de déploiement, de gestion et de mise à l'échelle, ce qui en fait une solution parfaitement adaptée à divers environnements d'entreprise.
Piloter un changement de paradigme dans le stockage
À mesure que les GPU deviennent de plus en plus puissants, accélérant l’entraînement de grands modèles d’IA, les systèmes de stockage de données doivent s’adapter aux exigences croissantes en matière d’intensité de calcul, de volume de données et de diversité des données. Les solutions de stockage traditionnelles, conçues initialement pour des charges de travail HPC prévisibles, sont souvent insuffisantes dans des domaines critiques pour l’IA moderne, tels que les lectures et écritures simultanées, les performances des métadonnées, la faible latence et les points de contrôle asynchrones.
Rob Lee, directeur technique chez Pure Storage, a souligné l'importance d'une solution capable de mettre à l'échelle les données et les métadonnées de manière indépendante. Il a souligné que l'architecture massivement parallèle de FlashBlade//EXA offre des performances, une évolutivité et une adaptabilité inégalées, notant que le stockage de nouvelle génération peut désormais activement stimuler l'évolution du HPC et de l'IA à grande échelle.
Une solution de stockage véritablement moderne doit proposer une conception désagrégée et parallèle pour accélérer efficacement l'IA à grande échelle. Les entreprises peuvent facilement ajouter des ressources pour suivre le rythme de la transformation rapide et continue de l'IA en s'éloignant d'une approche unique.
Alors, que sont les métadonnées et pourquoi sont-elles importantes ?
Les métadonnées désignent les informations sur les données stockées qui aident à leur identification, leur catégorisation, leur accessibilité et leur récupération. Dans la gestion des données et les baies de stockage, les métadonnées incluent des détails essentiels tels que les noms de fichiers, les tailles, les dates de création, les autorisations et les emplacements au sein du système de stockage. À mesure que les systèmes de stockage évoluent et que les ensembles de données deviennent plus volumineux, le volume des métadonnées augmente également de manière significative. Sans une gestion efficace des métadonnées, cette croissance peut entraîner des goulots d'étranglement des performances, une récupération des données plus lente et une latence accrue. Cela est particulièrement problématique pour les charges de travail d'IA et de HPC qui nécessitent un accès rapide et simultané à des ensembles de données massifs. Une gestion efficace des métadonnées est donc essentielle pour maintenir des performances, une fiabilité et une efficacité élevées dans les environnements de stockage à grande échelle.
Une architecture moderne pour les charges de travail d'IA et de HPC
Les technologies de stockage hautes performances traditionnelles ont été développées pour gérer les charges de travail HPC prévisibles axées sur l'évolution des performances brutes. En revanche, les tâches d'IA actuelles nécessitent le traitement de différents types de données (texte, images et vidéo) en parallèle sur des dizaines de milliers de GPU. Cette évolution nécessite des architectures qui optimisent les métadonnées tout en offrant des performances significatives pour gérer efficacement une concurrence importante.
FlashBlade//EXA répond à ces exigences avec une conception désagrégée et hautement parallèle qui cible les performances et la mise à l'échelle des métadonnées. Cette approche aide les entreprises à s'adapter aux modèles d'IA multimodaux en pleine croissance, à améliorer la fiabilité et à réduire les temps d'inactivité. Pour optimiser davantage les charges de travail d'IA et de HPC, FlashBlade//EXA intègre des cartes réseau NVIDIA ConnectX à haut débit, des commutateurs Spectrum, des câbles LinkX et des bibliothèques de communications accélérées, garantissant un déplacement transparent des données et des performances à faible latence pour la formation et l'inférence à grande échelle. En conséquence, les organisations peuvent accélérer la formation et l'inférence, maximiser l'utilisation du GPU et réduire le temps global d'obtention d'informations. De plus, en associant le moteur de métadonnées et le système d'exploitation Purity de Pure Storage à des nœuds de données économiques et de base, les entreprises peuvent obtenir un rapport prix/performance exceptionnel qui répond aux exigences des projets d'IA à grande échelle.
Principales fonctionnalités de FlashBlade//EXA
Performances de pointe à grande échelle
FlashBlade//EXA s'appuie sur la vaste expérience de Pure Storage en matière d'optimisation des métadonnées pour maximiser l'efficacité du pipeline pour la formation et l'inférence de l'IA. Selon les tests préliminaires, il peut fournir plus de 10 téraoctets par seconde de performances de lecture dans un seul espace de noms, établissant ainsi un nouveau seuil de performances dans le secteur. Cette capacité est basée sur un traitement massivement parallèle et des IOPS de métadonnées évolutives, permettant aux organisations de répondre de manière transparente aux exigences d'IA à haut débit.
Réduction de la complexité de la gestion
En supprimant les goulots d'étranglement des métadonnées, FlashBlade//EXA relève l'un des plus grands défis des charges de travail d'IA : gérer efficacement des ensembles de données volumineux. Les performances, la disponibilité et la résilience élevées des métadonnées permettent aux déploiements d'IA de s'exécuter sans réglage manuel ni configuration spécialisée. Par conséquent, les entreprises bénéficient de moins d'obstacles opérationnels lors de la gestion d'ensembles de données à grande échelle ou en évolution rapide.
Innovation accélérée en matière d'IA
L'architecture désagrégée de FlashBlade//EXA est hautement configurable et s'intègre aux protocoles standard de l'industrie, notamment aux bibliothèques de communications accélérées de NVIDIA, pour permettre la formation et l'inférence de l'IA à large bande passante. Cette intégration approfondie garantit que les entreprises maximisent l'utilisation du GPU tout en conservant la flexibilité nécessaire pour faire évoluer efficacement les charges de travail de l'IA. Cette conception favorise une évolution transparente au sein du paysage de l'IA et du HPC, garantissant que les organisations peuvent s'adapter rapidement aux nouveaux types de données, aux applications innovantes et aux modèles émergents sans compromettre les performances ou la fiabilité.
Disponibilité
La sortie de FlashBlade//EXA est prévue pour l'été 2025.
S'engager avec StorageReview
Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | Flux RSS