Pure Storage presenta FlashBlade//EXA, una plataforma de almacenamiento de HPC e IA de alto rendimiento que ofrece una velocidad de lectura de más de 10 TB/s a escala.
Pure Storage ha presentado FlashBlade//EXA, considerada la plataforma de almacenamiento de datos de mayor rendimiento de la industria, diseñada para gestionar las cargas de trabajo más exigentes de IA y computación de alto rendimiento (HPC). Esta nueva solución, basada en la probada arquitectura FlashBlade, elimina los cuellos de botella en los metadatos que históricamente limitaban el potencial de la IA. Diseñada para alta concurrencia y capaz de gestionar las extensas demandas de metadatos típicas de la IA y la HPC a gran escala, se prevé que FlashBlade//EXA proporcione más de 10 terabytes por segundo de rendimiento de lectura en un único espacio de nombres, estableciendo un nuevo estándar de rendimiento.
La arquitectura fundamental de FlashBlade//EXA escala datos y metadatos de forma independiente. Las organizaciones pueden lograr una expansión prácticamente ilimitada y un rendimiento multidimensional mediante el uso de nodos de datos de terceros fácilmente disponibles. Además, su dependencia de protocolos y estándares de red estándar simplifica los procesos de implementación, gestión y escalado, lo que lo convierte en una solución ideal para diversos entornos empresariales.
Impulsando un cambio de paradigma en el almacenamiento
A medida que las GPU se vuelven cada vez más potentes, acelerando el entrenamiento de grandes modelos de IA, los sistemas de almacenamiento de datos deben adaptarse a las crecientes demandas de intensidad computacional, volumen y diversidad de datos. Las soluciones de almacenamiento tradicionales, diseñadas inicialmente para cargas de trabajo de HPC predecibles, suelen presentar deficiencias en áreas críticas para la IA moderna, como lecturas y escrituras simultáneas, rendimiento de metadatos, baja latencia y puntos de control asíncronos.
Rob Lee, director de tecnología de Pure Storage, destacó la importancia de una solución que escale datos y metadatos de forma independiente. Destacó que la arquitectura masivamente paralela de FlashBlade//EXA ofrece un rendimiento, una escalabilidad y una adaptabilidad inigualables, y señaló que el almacenamiento de última generación ahora puede impulsar activamente la evolución de la HPC y la IA a gran escala.
Una solución de almacenamiento verdaderamente moderna debe ofrecer un diseño desagregado y paralelo para acelerar eficazmente la IA a escala. Las organizaciones pueden añadir recursos fácilmente para seguir el ritmo de la rápida y continua transformación de la IA, abandonando el enfoque universal.
Entonces, ¿qué son los metadatos y por qué son importantes?
Los metadatos se refieren a la información sobre los datos almacenados que facilita su identificación, categorización, accesibilidad y recuperación. En la gestión de datos y las matrices de almacenamiento, los metadatos incluyen detalles cruciales como nombres de archivo, tamaños, fechas de creación, permisos y ubicaciones dentro del sistema de almacenamiento. A medida que los sistemas de almacenamiento escalan y los conjuntos de datos crecen, el volumen de metadatos también aumenta significativamente. Sin una gestión eficiente de metadatos, este crecimiento puede generar cuellos de botella en el rendimiento, una recuperación de datos más lenta y una mayor latencia. Esto es especialmente problemático para las cargas de trabajo de IA y HPC que requieren acceso rápido y simultáneo a conjuntos de datos masivos. Por lo tanto, la gestión eficaz de los metadatos es crucial para mantener un alto rendimiento, fiabilidad y eficiencia en entornos de almacenamiento a gran escala.
Una arquitectura moderna para cargas de trabajo de IA y HPC
Las tecnologías de almacenamiento de alto rendimiento heredadas se desarrollaron para gestionar cargas de trabajo HPC predecibles, centradas en el escalado del rendimiento bruto. En cambio, las tareas de IA actuales requieren el procesamiento de diversos tipos de datos (texto, imágenes y vídeo) en paralelo en decenas de miles de GPU. Este cambio requiere arquitecturas que optimicen los metadatos y, al mismo tiempo, proporcionen un rendimiento significativo para gestionar una concurrencia considerable de forma eficiente.
FlashBlade//EXA aborda estos requisitos con un diseño desagregado y altamente paralelo que prioriza el rendimiento y el escalado de metadatos. Este enfoque ayuda a las empresas a adaptarse a los crecientes modelos de IA multimodal, mejorar la fiabilidad y reducir los tiempos de inactividad. Para optimizar aún más las cargas de trabajo de IA y HPC, FlashBlade//EXA integra tarjetas de red NVIDIA ConnectX de alta velocidad, conmutadores Spectrum, cables LinkX y bibliotecas de comunicaciones aceleradas, lo que garantiza una transferencia de datos fluida y un rendimiento de baja latencia para el entrenamiento y la inferencia a gran escala. Como resultado, las organizaciones pueden acelerar el entrenamiento y la inferencia, maximizar el uso de la GPU y reducir el tiempo total de obtención de información. Además, al combinar el motor de metadatos de Pure Storage y el sistema operativo Purity con nodos de datos básicos y rentables, las empresas pueden lograr una excelente relación calidad-precio que satisface las demandas de los proyectos de IA a gran escala.
Capacidades clave de FlashBlade//EXA
Rendimiento líder en la industria a escala
FlashBlade//EXA aprovecha la amplia experiencia de Pure Storage en optimización de metadatos para maximizar la eficiencia del flujo de trabajo para el entrenamiento e inferencia de IA. Según pruebas preliminares, puede ofrecer más de 10 terabytes por segundo de rendimiento de lectura en un solo espacio de nombres, lo que establece un nuevo estándar de rendimiento en la industria. Esta capacidad se basa en el procesamiento paralelo masivo y las IOPS de metadatos escalables, lo que permite a las organizaciones satisfacer las necesidades de IA de alta velocidad sin problemas.
Reducción de la complejidad de la gestión
Al eliminar los cuellos de botella de los metadatos, FlashBlade//EXA aborda uno de los mayores desafíos en las cargas de trabajo de IA: la gestión eficiente de conjuntos de datos masivos. El alto rendimiento, la disponibilidad y la resiliencia de los metadatos permiten que las implementaciones de IA se ejecuten sin necesidad de ajustes manuales ni configuraciones especializadas. Como resultado, las empresas se benefician de menos obstáculos operativos al gestionar conjuntos de datos a gran escala o en rápida evolución.
Innovación acelerada en IA
La arquitectura desagregada de FlashBlade//EXA es altamente configurable y se integra con los protocolos estándar de la industria, incluyendo las bibliotecas de comunicaciones aceleradas de NVIDIA, para permitir el entrenamiento e inferencia de IA con un alto ancho de banda. Esta profunda integración garantiza que las empresas maximicen el uso de la GPU, manteniendo la flexibilidad para escalar las cargas de trabajo de IA de forma eficiente. Este diseño promueve una evolución fluida dentro del panorama de la IA y la HPC, garantizando que las organizaciones puedan adaptarse rápidamente a nuevos tipos de datos, aplicaciones innovadoras y modelos emergentes sin comprometer el rendimiento ni la fiabilidad.
Disponibilidad
FlashBlade//EXA está programado para su lanzamiento en el verano de 2025.
Interactuar con StorageReview
Boletín | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS Feed