Inicio Empresa Plataforma de datos de aprendizaje profundo de datos VAST: creada para IA

Plataforma de datos de aprendizaje profundo de datos VAST: creada para IA

by harold fritts
gran plataforma de datos

VAST Data presentó una plataforma informática de datos diseñada para ser la base del descubrimiento asistido por IA. La plataforma de datos VAST es la oferta más reciente que unifica el almacenamiento, la base de datos y los servicios de motor de cómputo virtualizado en un sistema escalable creado desde cero para el futuro de la IA.

VAST Data presentó una plataforma informática de datos diseñada para ser la base del descubrimiento asistido por IA. La plataforma de datos VAST es la oferta más reciente que unifica el almacenamiento, la base de datos y los servicios de motor de cómputo virtualizado en un sistema escalable creado desde cero para el futuro de la IA.

La plataforma de datos VAST se creó para incluir los volúmenes de datos globales generados y procesados ​​en tiempo real, incluidos datos estructurados y no estructurados como videos, imágenes, texto libre, flujos de datos y datos de instrumentos. Este enfoque tiene como objetivo cerrar la brecha entre las arquitecturas basadas en eventos y las basadas en datos con la capacidad de acceder y procesar datos en cualquier centro de datos de nube pública o privada, incorporar capas semánticas consultables en los datos para comprender mejor los datos naturales y calcular datos. en tiempo real de forma continua y recursiva con cada interacción.gran plataforma de datos

Más allá de los grandes modelos de lenguaje hasta el descubrimiento asistido por IA

La IA generativa y los modelos de lenguaje grande (LLM) introdujeron al mundo las primeras capacidades de la inteligencia artificial; sin embargo, los LLM se limitan a realizar tareas rutinarias como informes comerciales o recitar información ya conocida. Solo cuando las máquinas puedan recrear el proceso de descubrimiento capturando, sintetizando y aprendiendo de los datos, se hará realidad la verdadera promesa de la IA. Este nivel de especialización ahora se puede lograr en cuestión de días en lugar de décadas.

El descubrimiento impulsado por IA acelerará la búsqueda para resolver nuestros mayores desafíos, encontrar tratamientos para enfermedades y cánceres, abordar el cambio climático, enfoques innovadores para la agricultura y descubrir nuevos campos de la ciencia y las matemáticas. Las plataformas de datos existentes son populares para las empresas globales, lo que reduce drásticamente la complejidad de la implementación de la infraestructura para las aplicaciones de informes e inteligencia comercial. Sin embargo, aún deben satisfacer las necesidades de las nuevas aplicaciones de aprendizaje profundo.

La próxima generación de infraestructura de IA debe ofrecer acceso a archivos paralelos, rendimiento optimizado por GPU para el entrenamiento de redes neuronales y la inferencia de datos no estructurados, y un espacio de nombres global que abarque entornos híbridos de varias nubes y de borde; todo unificado dentro de una oferta fácil de administrar que permite el aprendizaje profundo federado.

DASE: El corazón de la plataforma de datos VAST

Desde sus inicios, VAST ha colocado datos naturales, metadatos enriquecidos, funciones y activadores en el centro de la arquitectura de sistemas distribuidos VAST Disgregated Shared-Everything (DASE). Al eliminar las compensaciones de rendimiento, capacidad, escala, simplicidad y resiliencia, DASE ha sentado las bases de datos para el aprendizaje profundo, lo que hace posible entrenar modelos en la totalidad de los datos de una empresa. Al permitir que los clientes agreguen lógica al sistema, las máquinas pueden enriquecer y comprender de forma continua y recursiva los datos del mundo natural.

Los nuevos anuncios de la hoja de ruta de VAST ofrecen una forma de acelerar los flujos de trabajo de capacitación. Para las grandes empresas, es fundamental contar con una ruta de implementación rápida para la IA generativa. VAST expuso sus planes para ayudar a lograr esto al poder ejecutar funciones de tipo transformador en objetos almacenados en su plataforma. Tomemos, por ejemplo, las distorsiones aleatorias aplicadas a un conjunto de imágenes de entrenamiento, las funciones que llegan a la plataforma VAST permitirían transformaciones en los datos de entrenamiento según sea necesario, en lugar de tener que preprocesarlos a costa de consumir más almacenamiento.

Los desarrollos de VAST que prometen acelerar los flujos de trabajo de capacitación abren un nuevo horizonte para la IA generativa dentro de las empresas que requieren alta fidelidad, respuesta rápida de capacitación y modelado complejo. La industria altamente regulada se beneficiará enormemente. Los analistas pueden aprovechar las capacidades de VAST para ejecutar funciones de transformador en objetos, generando modelos detallados cuya creación manual requeriría mucho tiempo y espacio. La generación y modificación en tiempo real de elementos gráficos también puede mejorar el flujo de trabajo creativo, lo que permite un proceso de diseño más dinámico e interactivo.

Almacén de datos global unificado, base de datos y motor informático de IA

VAST DataStore es una arquitectura de almacenamiento escalable para datos no estructurados que elimina el almacenamiento en niveles. Diseñado para capturar y servir datos del mundo natural, VAST primero diseñó la base de su plataforma. VAST DataStore es una plataforma de almacenamiento conectada a la red empresarial creada para satisfacer las necesidades de arquitecturas informáticas robustas de IA, como las supercomputadoras NVIDIA DGX SuperPOD AI y las plataformas HPC y de big data.

La eficiencia de DataStore a escala de exabyte aporta economía de archivo a la infraestructura flash, lo que la hace adecuada para aplicaciones de archivo. Resolver el costo del almacenamiento flash es fundamental para sentar las bases del aprendizaje profundo para los clientes empresariales, ya que buscan entrenar modelos en sus activos de datos patentados.

Base de datos VAST

Se ha introducido VAST DataBase para aplicar estructura a datos naturales no estructurados. Al combinar las características de una base de datos, un almacén de datos y un lago de datos, todo en un sistema de administración de base de datos simple, distribuido y unificado, VAST ha resuelto las compensaciones entre transacciones (para capturar y catalogar datos naturales en tiempo real) y análisis. (para analizar y correlacionar datos en tiempo real). Base de datos VAST Diseñada para la captura rápida de datos y consultas rápidas a cualquier escala, la base de datos VAST rompe las barreras del análisis en tiempo real desde el flujo de eventos hasta el archivo.

Con una base para datos estructurados y no estructurados sintetizados, la plataforma de datos VAST hace posible refinar y enriquecer datos no estructurados sin procesar en información estructurada y consultable con soporte para funciones y disparadores. VAST DataEngine es un motor de ejecución de funciones globales que consolida los centros de datos y las regiones de la nube en un marco computacional global. El motor admite lenguajes de programación populares, como SQL y Python. Introduce un sistema de notificación de eventos y un modelo de formación materializado y reproducible que facilita la gestión de las canalizaciones de IA.

Espacio de datos VAST

El elemento final de la estrategia de la plataforma de datos VAST es el VAST DataSpace. Este espacio de nombres global permite que todas las ubicaciones almacenen, recuperen y procesen datos desde cualquier ubicación con un alto rendimiento, al tiempo que imponen una coherencia estricta en todos los puntos de acceso. Con DataSpace, la plataforma de datos VAST se puede implementar en centros de datos locales y entornos perimetrales. Ahora también amplía el acceso de DataSpace a las principales plataformas de nube pública, incluidas AWS, Microsoft Azure y Google Cloud.

Esta plataforma informática global definida por datos adopta un nuevo enfoque para combinar datos no estructurados con datos estructurados al almacenar, procesar y distribuir esos datos desde un único sistema unificado.

El almacén de datos, la base de datos y el espacio de datos de VAST están generalmente disponibles en la plataforma de datos de VAST en la actualidad. El VAST DataEngine estará disponible en 2024.

Obtenga más información visitando Vast's Construir más allá.ai.

Interactuar con StorageReview

Boletín | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS Feed