Home EmpreendimentoAI IBM adiciona modelos Llama 4 da Meta ao watsonx.ai

IBM adiciona modelos Llama 4 da Meta ao watsonx.ai

by Haroldo Fritts

A IBM integra dois dos modelos mais recentes do Llama 4 da Meta, Scout e Maverick, na plataforma watsonx.ai.

A IBM integrou os modelos de IA de código aberto mais recentes da Meta:lhama 4 Scout e Llama 4 Maverick — em sua plataforma watsonx.ai. Esses modelos de mistura de especialistas (MoE) de última geração foram projetados para oferecer recursos multimodais de alto desempenho com eficiência de custos, escalabilidade e poder de processamento significativamente aprimorados. Com a adição do Llama 4, a IBM agora oferece suporte a 13 metamodelos na watsonx.ai, reforçando seu compromisso com uma abordagem aberta e multimodelo para IA generativa.

Arquitetura de Mistura de Especialistas: Eficiência Sem Comprometimento

Os novos modelos Llama 4 da Meta representam um avanço significativo na arquitetura de IA. Ambos os modelos utilizam MoE, que ativa de forma inteligente apenas um subconjunto de "especialistas" do modelo para cada token, em vez de envolver toda a rede. Essa estratégia de inferência direcionada aumenta a produtividade e reduz as despesas operacionais sem comprometer a qualidade.

Lhama 4 Scout possui 109 bilhões de parâmetros totais, divididos entre 16 especialistas, mas apenas 17 bilhões de parâmetros estão ativos durante a inferência. Essa configuração eficiente permite maior simultaneidade e tempos de resposta mais rápidos, além de oferecer desempenho excepcional em tarefas de codificação, raciocínio de contexto longo e compreensão de imagens. Apesar de seu tamanho compacto, o Scout é treinado em 40 trilhões de tokens e supera modelos com conjuntos de parâmetros ativos significativamente maiores.

Lhama 4 Maverick vai além com 400 bilhões de parâmetros e 128 especialistas, ainda operando com apenas 17 bilhões de parâmetros ativos por inferência. O Meta relata que o Maverick supera o GPT-4o da OpenAI e o Gemini 2.0 Flash do Google em todos os aspectos em benchmarks multimodais, e iguala o desempenho do DeepSeek-V3 em cargas de trabalho de raciocínio e codificação, apesar de ser muito mais eficiente.

Modelo Parâmetros totais Parâmetros Ativos Número de especialistas Janela de contexto
Lhama 4 Scout 109B 17B 16 10 milhões de tokens
Lhama 4 Maverick 400B 17B 128 10 milhões de tokens

Liderando o caminho em IA de longo contexto

O Llama 4 Scout apresenta uma janela de contexto inovadora de até 10 milhões de tokens — atualmente a mais longa do setor. Esse avanço permite sumarização de múltiplos documentos, análise aprofundada da base de código e personalização do usuário a longo prazo. A Meta atribui esse marco a duas inovações arquitetônicas: camadas de atenção intercaladas (sem embeddings posicionais) e uma técnica de escalonamento de atenção por tempo de inferência. Coletivamente chamadas de "iRope", essas melhorias aproximam a Meta de sua visão de IA com comprimento de contexto infinito.

Multimodalidade nativa para casos de uso do mundo real

Os LLMs tradicionais são treinados exclusivamente com base em texto e, em seguida, adaptados para outros tipos de dados. Em contraste, os modelos Llama 4 são considerados "nativamente multimodais", o que significa que são treinados do zero usando uma combinação de dados de texto, imagem e vídeo. Isso permite que eles processem vários tipos de entrada naturalmente e forneçam resultados mais integrados e com foco no contexto.

Durante o treinamento, os modelos combinam dados visuais e de linguagem nos estágios iniciais de processamento, ensinando efetivamente o sistema a interpretar e raciocinar simultaneamente em diferentes modalidades. O resultado é um desempenho superior no raciocínio baseado em imagens, incluindo a capacidade de processar múltiplas imagens por prompt e associar elementos visuais específicos a respostas textuais.

Implantação corporativa no IBM watsonx

Com o watsonx.ai, desenvolvedores e empresas podem acessar o Llama 4 Scout ou o Maverick e ajustá-los, destilá-los e implementá-los em ambientes de nuvem, on-premise ou edge. A plataforma de nível empresarial da IBM suporta todo o ciclo de vida da IA, fornecendo ferramentas para desenvolvedores de todos os níveis de habilidade — desde programação até ambientes de baixo código e sem código.

O watsonx.ai inclui integrações pré-criadas com bancos de dados vetoriais, estruturas de agentes e infraestrutura avançada que facilitam a operacionalização da IA ​​em escala. Ferramentas robustas de governança garantem conformidade, segurança e auditabilidade de nível empresarial, ajudando as equipes a desenvolver com responsabilidade e implementar com mais rapidez.

Uma Aliança Estratégica para a Transformação da IA

A parceria da IBM com a Meta une inovação aberta com prontidão empresarial prática. À medida que a Meta amplia os limites da arquitetura de modelos, a IBM oferece a infraestrutura, a governança e a flexibilidade de implantação que as empresas contemporâneas exigem para avançar rapidamente sem sacrificar o controle ou a relação custo-benefício.

A chegada do Llama 4 ao watsonx.ai fornece aos clientes da IBM um novo conjunto de ferramentas de alto desempenho para desbloquear valor em uma ampla gama de casos de uso, sem dependência de fornecedor e com a garantia de operar em uma plataforma projetada para a empresa.

Envolva-se com a StorageReview

Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS feed