IBM integra dos de los últimos modelos Llama 4 de Meta, Scout y Maverick, en la plataforma watsonx.ai.
IBM ha integrado los últimos modelos de IA de código abierto de Meta:llamas 4 Scout y Llama 4 Maverick en su plataforma watsonx.ai. Este modelo de mezcla de expertos (MoE) de última generación está diseñado para ofrecer capacidades multimodales de alto rendimiento con una rentabilidad, escalabilidad y potencia de procesamiento significativamente mejoradas. Con la incorporación de Llama 4, IBM ahora admite 13 metamodelos en watsonx.ai, lo que refuerza su compromiso con un enfoque abierto y multimodelo para la IA generativa.
Arquitectura Mixta de Expertos: Eficiencia sin Compromiso
Los nuevos modelos Llama 4 de Meta representan un avance significativo en la arquitectura de IA. Ambos modelos utilizan MoE, que activa inteligentemente solo un subconjunto de "expertos" del modelo para cada token, en lugar de involucrar a toda la red. Esta estrategia de inferencia dirigida aumenta el rendimiento y reduce los gastos operativos sin comprometer la calidad.
Llama 4 Scout Cuenta con un total de 109 mil millones de parámetros, distribuidos entre 16 expertos; sin embargo, solo 17 mil millones de parámetros están activos durante la inferencia. Esta eficiente configuración permite una mayor concurrencia y tiempos de respuesta más rápidos, a la vez que ofrece un rendimiento excepcional en tareas de codificación, razonamiento de contexto extenso y comprensión de imágenes. A pesar de su tamaño compacto, Scout se entrena con 40 billones de tokens y supera a los modelos con conjuntos de parámetros activos significativamente mayores.
Llama 4 Maverick Lleva las cosas más allá con 400 mil millones de parámetros y 128 expertos, operando aún con tan solo 17 mil millones de parámetros activos por inferencia. Meta informa que Maverick supera a GPT-4o de OpenAI y a Gemini 2.0 Flash de Google en general en pruebas de referencia multimodales, e iguala el rendimiento de DeepSeek-V3 en cargas de trabajo de razonamiento y codificación, a pesar de ser mucho más eficiente.
Modelo | Parámetros totales | Parámetros activos | Número de expertos | Ventana de contexto |
---|---|---|---|---|
Llama 4 Scout | 109B | 17B | 16 | 10 millones de fichas |
Llama 4 Maverick | 400B | 17B | 128 | 10 millones de fichas |
Liderando el camino en IA de contexto largo
Llama 4 Scout presenta una innovadora ventana de contexto de hasta 10 millones de tokens, actualmente la más extensa de la industria. Este avance permite la síntesis de múltiples documentos, el análisis exhaustivo de la base de código y la personalización del usuario a largo plazo. Meta atribuye este hito a dos innovaciones arquitectónicas: capas de atención intercaladas (sin incrustaciones posicionales) y una técnica de escalado de atención en tiempo de inferencia. Conocidas colectivamente como "iRope", estas mejoras acercan a Meta a su visión de una IA de longitud de contexto infinita.
Multimodalidad nativa para casos de uso del mundo real
Los modelos LLM tradicionales se entrenan únicamente con texto y luego se adaptan a otros tipos de datos. En cambio, los modelos Llama 4 se consideran "multimodales nativos", lo que significa que se entrenan desde cero utilizando una combinación de datos de texto, imagen y vídeo. Esto les permite gestionar diversos tipos de entrada de forma natural y proporcionar resultados más integrados y contextuales.
Durante el entrenamiento, los modelos fusionan datos visuales y lingüísticos en las primeras etapas de procesamiento, enseñando eficazmente al sistema a interpretar y razonar simultáneamente entre distintas modalidades. El resultado es un rendimiento superior en el razonamiento basado en imágenes, incluyendo la capacidad de procesar múltiples imágenes por cada indicación y asociar elementos visuales específicos con respuestas textuales.
Implementación empresarial en IBM WatsonX
Con watsonx.ai, desarrolladores y empresas pueden acceder a Llama 4 Scout o Maverick y optimizarlos, destilarlos e implementarlos en entornos de nube, locales o edge. La plataforma empresarial de IBM soporta todo el ciclo de vida de la IA, proporcionando herramientas para desarrolladores de todos los niveles, desde programación hasta entornos low-code y sin código.
watsonx.ai incluye integraciones predefinidas con bases de datos vectoriales, marcos de agentes e infraestructura avanzada que facilitan la implementación de IA a escala. Sus robustas herramientas de gobernanza garantizan cumplimiento normativo, seguridad y auditabilidad de nivel empresarial, lo que ayuda a los equipos a desarrollar de forma responsable e implementar con mayor rapidez.
Una alianza estratégica para la transformación de la IA
La alianza de IBM con Meta fusiona la innovación abierta con la preparación empresarial práctica. A medida que Meta amplía los límites de la arquitectura de modelos, IBM ofrece la infraestructura, la gobernanza y la flexibilidad de implementación que las empresas contemporáneas necesitan para avanzar con rapidez sin sacrificar el control ni la rentabilidad.
La llegada de Llama 4 a watsonx.ai proporciona a los clientes de IBM un nuevo conjunto de herramientas de alto rendimiento para desbloquear valor en una amplia gama de casos de uso, sin dependencia de un proveedor y con la seguridad de operar en una plataforma diseñada para la empresa.
Interactuar con StorageReview
Boletín | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS Feed