ArmazenamentoReview.com

Como a Metrum AI e a Universidade Estadual do Oregon estão construindo o novo padrão para avaliação acadêmica.

AI  ◇  Empreendimento

Quando publicamos nossa matéria sobre Pesquisa de imagens de plâncton da Universidade Estadual do Oregon Em novembro passado, a manchete era a ciência: infraestrutura acelerada por IA a bordo de navios de pesquisa, processando terabytes de dados oceânicos em tempo quase real, antes mesmo de o navio chegar ao porto. Mas algo mais aconteceu silenciosamente nas semanas seguintes. A notícia se espalhou pelo campus sobre o que um único Dell PowerEdge XE7745 com oito SSDs Solidigm D5-P5336 E3.S e GPUs NVIDIA RTX PRO 6000 poderia realmente realizar. Outros departamentos começaram a fazer perguntas. Então, começaram a fazer ligações. Christopher Sullivan, Diretor de Pesquisa e Computação Acadêmica da Faculdade de Ciências da Terra, Oceano e Atmosfera da OSU, agora quer um rack desses servidores para atender à crescente demanda por IA em toda a universidade, e a história por trás dessa ambição vai muito além do plâncton.

A Universidade Estadual do Oregon se consolidou como uma das universidades mais inovadoras do país na adoção da IA ​​tanto para pesquisa quanto para uso acadêmico. As decisões de infraestrutura tomadas no campus hoje, juntamente com a formação de parcerias com empresas como Metrum AI, Dell, NVIDIA e Solidigm, não são apenas experimentos acadêmicos. Elas lançam as bases para uma nova forma de as universidades oferecerem educação, avaliarem o aprendizado e protegerem seus alunos. Esta é a história de como esse modelo foi desenvolvido.

O problema que a IA generativa agravou

Durante décadas, os trabalhos escritos foram essenciais para a avaliação acadêmica. Entregava-se um texto, demonstrava-se compreensão e recebia-se uma nota. A IA generativa alterou fundamentalmente esse sistema. Agora, um aluno pode elaborar uma redação impecável e bem estruturada com pouco envolvimento real com o conteúdo, e mesmo professores experientes não conseguem determinar com certeza se se trata de um trabalho autêntico. A evidência de compreensão genuína, na qual as universidades se basearam por gerações, tornou-se frágil.

A alternativa óbvia é a avaliação oral. Peça aos alunos que expliquem seu raciocínio em voz alta, descrevam sua análise e defendam suas conclusões. Isso é difícil de simular. O problema é a escala. Um professor com 200 alunos não pode sentar-se individualmente com cada um e realizar uma prova oral substancial. Na universidade moderna, essa limitação praticamente relegou a avaliação oral a um segundo plano como principal ferramenta de avaliação. O Metrum AI foi criado para mudar essa realidade.

O que a Metrum AI construiu

Metrum IAA Metrum, cofundada pelo CEO Steen Graham e pelo CTO Chetan Gadgil, foi construída em torno de uma convicção simples: a IA deve realizar trabalho operacional real, e não apenas demonstrar potencial. A empresa implementa agentes de IA multimodais que raciocinam a partir de vídeo, áudio, documentos e dados estruturados para clientes em diversos setores, de seguros à manufatura. A Metrum desenvolveu uma parceria sólida com a Dell Technologies, validando suas plataformas na infraestrutura de servidores corporativos da Dell em uma variedade de configurações de GPU. O sistema de avaliação acadêmica na Universidade Estadual do Oregon não representa uma mudança radical para a Metrum; trata-se da mesma capacidade subjacente aplicada a um novo domínio de problemas, com a mesma filosofia de design local e com interação humana que permeia tudo o que a empresa desenvolve.

fluxo de trabalho metrum ai estado do Oregon

Aplicada à avaliação acadêmica, a plataforma processa apresentações em vídeo gravadas de alunos usando IA multimodal e retorna avaliações preliminares alinhadas a critérios de avaliação para revisão do corpo docente. A proposta é clara: oferecer aos instrutores um parceiro de IA que lide com o trabalho repetitivo e demorado de extração de dados, para que eles possam se concentrar nas decisões que realmente exigem julgamento humano.

Em termos funcionais, a plataforma realiza três operações. Ela extrai artefatos multimodais de vídeos enviados, gerando transcrições de áudio com marcação de tempo usando o OpenAI Whisper e capturando o conteúdo dos slides por meio de análise visual com o auxílio do Qwen3-VL-30B. Em seguida, aplica rubricas elaboradas pelo instrutor ao conteúdo extraído, utilizando modelos de raciocínio do Qwen3-30B-A3B executados no vLLM. Por fim, apresenta avaliações preliminares com indicadores de evidência, vinculando cada nota a um ponto específico da transcrição ou a um identificador de slide para revisão e aprovação do corpo docente antes que o material chegue ao aluno.

metrum ai tela do estado de Oregon

Essa etapa final é crucial. Nenhuma nota, comentário ou feedback fica visível para os alunos até que um instrutor o revise, faça as modificações necessárias e o aprove explicitamente. O sistema é baseado na autoridade do corpo docente. Além disso, a plataforma opera inteiramente em infraestrutura própria. Essa decisão influencia todos os aspectos do funcionamento do sistema, quem confia nele e qual hardware ele exige.

tela 2 do estado de metrum ai oregon

De um projeto paralelo de um professor a uma determinação do reitor

Jonathan Kalodimos é professor associado de Finanças e detentor da Cátedra Harley e Brigitte Smith na Faculdade de Administração da Universidade Estadual do Oregon. Sua trajetória não é o que se esperaria de alguém no centro de uma história sobre infraestrutura de IA. Antes de ingressar na OSU, ele era economista financeiro na Comissão de Valores Mobiliários dos EUA (SEC), onde atuou como economista-chefe na Seção 954 da Lei Dodd-Frank, que estabeleceu regras sobre a recuperação de bônus na remuneração de executivos. Suas pesquisas sobre governança corporativa e regulação financeira foram citadas no The Wall Street Journal, The New York Times, Bloomberg e Harvard Business Review. Além disso, ele possui o instinto de um físico para medir coisas com precisão.

metrum ai estado do Oregon Jon

Há cerca de um ano, Kalodimos criou uma ferramenta simples para sua turma de MBA: um agente de IA para avaliar a parte oral de apresentações de estudos de caso. Os alunos ficaram impressionados com a qualidade do feedback. Ele apresentou o projeto durante a Semana de IA na Universidade Estadual do Oregon. A Dell percebeu o potencial, o conectou à Metrum AI e um experimento em sala de aula se transformou em algo muito maior.

“Uma vez que você tenha a ferramenta, poderá aprimorar seu estilo e seus métodos de ensino para aproveitar os pontos fortes da ferramenta e proporcionar uma melhor experiência educacional.”

— Jonathan Kalodimos, Professor Associado de Finanças e Bolsista Harley & Brigitte Smith, Universidade Estadual do Oregon

O que Kalodimos está desenvolvendo é o que ele chama de extração baseada em evidências, sustentada pelo que ele descreve como engenharia de rubricas. Isso engloba determinar quais características podem ser extraídas da apresentação de um aluno, agregar essas características em resultados de aprendizagem e fornecer aos professores uma visão estruturada de onde cada aluno demonstrou compreensão e onde apresentou dificuldades. "A maneira como explico isso aos alunos céticos", disse ele, "é como se eu tivesse uma lista de verificação muito detalhada e analisasse a apresentação de vocês marcando os itens que vocês fizeram; é isso que o sistema faz. Obviamente, é muito mais sofisticado do que isso, mas me permite ver todas as oportunidades para o aluno demonstrar que domina o conteúdo."

Ele ofereceu dois exemplos que ilustram como o sistema muda na prática. No primeiro, um aluno condensou uma apresentação de dez minutos em cinco, falou em tom monótono e em um ritmo como se o inglês fosse sua segunda língua. Sua apresentação obscureceu completamente sua compreensão. "Mesmo ouvindo atentamente", disse Kalodimos, "eu simplesmente não conseguia, ou não queria, analisar a apresentação com esse nível de detalhamento para superar a dificuldade de apresentação e me concentrar nas evidências em si." Quando ele posteriormente analisou a análise das evidências gerada por IA em incrementos de quinze segundos, ficou claro que o aluno havia compreendido o conteúdo. A apresentação havia sido avaliada, não o conhecimento.

O segundo caso envolveu um aluno que construiu uma apresentação lentamente, com slides aparentemente desconexos, e só conseguiu sintetizar o argumento no slide final. Assistindo à apresentação ao vivo, Kalodimos já havia formado uma opinião negativa sobre ela. O sistema avaliou o trabalho como um todo, como um arco narrativo completo, e atribuiu uma boa nota. "Eu nem imaginava que esse seria um benefício desse tipo de avaliação", disse ele. "Isso elimina a necessidade de considerar o tempo como fator determinante da avaliação."

Christopher Sullivan, Diretor de Pesquisa e Computação Acadêmica, é o responsável pela infraestrutura na implementação. Seu envolvimento se intensificou quando uma lacuna crítica de conformidade surgiu no projeto original da Metrum e da Dell.

FERPA, Soberania de Dados e Por Que a Nuvem Não é a Resposta

Quando Sullivan assumiu a implementação local da plataforma Metrum na OSU, a primeira coisa que identificou foi um problema que ninguém havia resolvido completamente: a Lei de Direitos Educacionais e Privacidade da Família (FERPA).

A FERPA é a lei federal que rege os registros acadêmicos dos alunos. Ela estabelece requisitos rigorosos sobre quem pode acessar os dados dos alunos, sob quais condições e como esses dados devem ser protegidos. Para um sistema como o da Metrum, que recebe vídeos enviados pelos alunos, gera históricos escolares, produz avaliações e armazena o histórico completo de cada decisão de nota, a conformidade com a FERPA não é uma mera formalidade; é uma restrição arquitetônica.

“Precisávamos de uma solução local que atendesse a todas as minhas exigências da FERPA”, disse Sullivan, “mas que também tivesse uma grande capacidade de armazenamento.” O processamento em nuvem não era compatível com esse requisito. Rotear arquivos de vídeo, transcrições de áudio e registros de avaliação de alunos por meio de APIs de IA externas significaria transmitir informações pessoais identificáveis ​​dos alunos para sistemas de terceiros fora do controle direto da universidade. A complexidade contratual e técnica de manter a conformidade com a FERPA nesse ambiente, envolvendo todos os fornecedores da cadeia, tornou a ideia inviável.

Há também uma dimensão prática relacionada à experiência do aluno. Os alunos que enviam apresentações gravadas oferecem algo pessoal: sua voz, seu rosto, seu raciocínio sob pressão, às vezes em um idioma que não é o seu nativo. Quando eles entendem que seu vídeo está armazenado em um servidor da OSU, processado por um modelo executado em hardware da OSU e regido pelas próprias políticas de dados da OSU, a dinâmica muda. Kalodimos viu isso acontecer diretamente durante o projeto piloto. "A ideia de que este era um modelo local com armazenamento local e que a OSU estava apoiando o aluno", disse ele, "era palpável. Precisamos realmente usar a confiança institucional que a OSU construiu, protegendo nossos alunos e aproveitando essas soluções locais."

As plataformas de IA na nuvem são fáceis e rápidas de implementar, mas exigem que as instituições confiem em um contrato em vez de em sua arquitetura. Para os alunos que já estão preocupados com a forma como seus dados são gerenciados, essa distinção pode influenciar significativamente sua disposição em adotá-las. A implementação local não se trata apenas de conformidade; ela estabelece uma base de confiança.

O piloto, o reitor e o que vem a seguir na OSU

O projeto piloto está em andamento. Aproximadamente 500 alunos de diversas turmas estão entregando seus projetos finais ao término da semana de provas. As avaliações com notas devem ser devolvidas em até 4 dias após a última entrega. Os relatórios gerados por IA precisam estar prontos antes que os professores comecem a corrigir as provas. "Há um componente humano funcionando em paralelo", observou Kalodimos, "mas eles precisam do relatório primeiro. Se levar dois dias para processar tudo isso, o fator humano fica ainda mais sobrecarregado." A pressão é real, o prazo é fixo e a infraestrutura está funcionando.

O projeto piloto revelou outro ponto importante. Quando um professor foi promovido recentemente a um cargo administrativo no meio do semestre, um instrutor teve que assumir o cargo às pressas e concluir o curso. A existência de uma estrutura consistente de avaliação por IA, com rubricas definidas e um fluxo de trabalho de revisão estabelecido, proporcionou a esse instrutor uma continuidade que, de outra forma, não existiria. "Ter um sistema de avaliação por IA consistente", disse Kalodimos, "com certeza vai melhorar a experiência do aluno" justamente nessas situações em que a continuidade do ensino humano não pode ser garantida.

A história acabou chegando ao Reitor da OSU. Kalodimos apresentou toda a infraestrutura: o sistema Dell, o desempenho do armazenamento Solidigm, os recursos para desenvolvedores e os benchmarks de infraestrutura, em uma reunião que deveria durar dez minutos. Ela se estendeu por quarenta minutos. O Reitor enviou um e-mail ao CIO, ao CTO e a Sullivan. A OSU agora planeja uma implementação em toda a universidade para disponibilizar o recurso ao corpo docente a partir do semestre de primavera, gerenciado por um escritório de Computação para Pesquisa recém-criado, subordinado ao Reitor e ao escritório de pesquisa.

Sullivan está pensando nessa implementação em termos de infraestrutura em escala de rack. A mesma plataforma XE7745 que serviu de base para o trabalho de imageamento de plâncton e que agora alimenta o pipeline de avaliação de IA do Metrum é a base que ele deseja escalar. O objetivo é um rack desses servidores, disponível para alternar entre cargas de trabalho de computação acadêmica e de pesquisa conforme a demanda muda. Idealmente, os servidores seriam dedicados ao pipeline de avaliação do Metrum durante os picos de entrega de trabalhos acadêmicos e finais, e redistribuídos para cargas de trabalho de pesquisa durante os períodos mais tranquilos do calendário acadêmico. "Podemos pegar máquinas desse conjunto e colocá-las no lado da computação acadêmica por um período de tempo e, em seguida, trazê-las de volta e utilizá-las para a computação de pesquisa", disse Sullivan. "Queremos poder redistribuí-las instantaneamente."

A adoção orgânica já está em andamento. Docentes da Faculdade de Saúde e da Faculdade de Engenharia entraram em contato com a Kalodimos de forma independente, após tomarem conhecimento do projeto por meio de canais informais. A plataforma não foi anunciada formalmente além do projeto piloto. Mesmo assim, encontrou seu público.

O problema de capacidade por trás do problema de classificação

Existe uma versão dessa história que trata apenas da aceleração do processo de correção de provas. Essa é uma visão incompleta.

A versão mais abrangente trata da capacidade das turmas. Sullivan descreveu um curso de geologia de nível introdutório, uma disciplina que a OSU considera parte essencial de sua missão educacional e que todos os alunos devem cursar. Atualmente, o curso é oferecido em duas turmas de 300 alunos cada, totalizando 600 por trimestre. Os instrutores estão sobrecarregados. Adicionar novas turmas não é viável, considerando a carga horária atual. "Não posso sobrecarregar os professores", disse Sullivan. "Preciso encontrar maneiras de criarmos mais turmas, reduzindo a carga horária, ou de acomodar mais alunos nas turmas existentes."

Kalodimos descreveu de forma semelhante a dimensão da Faculdade de Administração. Professores com turmas limitadas a 45 alunos por questões de segurança contra incêndio teriam a opção de explorar formatos de grandes palestras com suporte de salas de discussão, assim que a avaliação individualizada pudesse ser implementada em larga escala. "Não se trata apenas de lotar as salas", disse ele. "Trata-se de manter a qualidade enquanto exploramos diferentes modalidades de ensino." A camada de avaliação por IA é o que torna a avaliação individualizada em escala de sala de aula operacionalmente possível.

“A IA está nos ajudando a aumentar os números sem alterar o impacto, a mensagem ou o que está sendo aprendido.”

— Christopher Sullivan, Diretor de Pesquisa e Computação Acadêmica, Universidade Estadual do Oregon

O espaço de armazenamento era a peça que faltava.

Quando Sullivan avaliou o que seria necessário para implementar o sistema Metrum nas instalações da OSU com total conformidade com a FERPA, a questão da GPU já estava resolvida. A arquitetura de referência da Metrum e da Dell havia demonstrado que o XE7745 com GPUs NVIDIA RTX PRO 6000 poderia lidar com a carga de trabalho de inferência em grande escala. O que ainda precisava ser resolvido era o armazenamento.

O XE7745 é uma plataforma 4U refrigerada a ar, otimizada para alta densidade de GPUs. Esse design é seu ponto forte, mas apresenta uma limitação real: o número de baias para unidades de armazenamento é limitado. "Eu precisava aproveitar ao máximo o espaço disponível em um único equipamento sem comprometer a velocidade", disse Sullivan, "porque não queria perder todo o potencial das GPUs e tudo o que o XE7745 representava. E realmente não havia muitas soluções de SSD de alta capacidade disponíveis no mercado que atendessem a essa necessidade."

A camada de armazenamento em um sistema como este suporta mais do que a carga de trabalho principal da IA. Arquivos de vídeo chegam do portal do aluno e precisam de um local para serem armazenados em buffer imediatamente. Faixas de áudio extraídas e transcrições com registro de data e hora são armazenadas como artefatos distintos para revisão do corpo docente. Imagens de slides e saídas de OCR ocupam sua própria camada. O banco de dados Supabase, que rastreia metadados de submissão, avaliações de rascunhos, edições do corpo docente e registros de aprovação, funciona continuamente. Os pesos dos modelos Whisper, Qwen3-VL e do modelo de raciocínio precisam ser carregados com rapidez suficiente para evitar gargalos de inferência. E o histórico completo de auditoria para cada rascunho gerado por IA, cada alteração feita pelo corpo docente e cada ação de aprovação deve ser mantido como um registro consultável para revisões de acreditação, investigações de integridade acadêmica e relatórios administrativos.

Cada uma dessas cargas de trabalho reside no armazenamento. A GPU recebe o crédito pela saída de IA. O armazenamento mantém a GPU alimentada e funcionando continuamente.

A equipe de Sullivan selecionou o Solidigm D5-P5336 no formato E3.S. O chassi XE7745 comporta oito dessas unidades. Com 30.72 TB por unidade, isso representa mais de 245 TB de armazenamento flash em um único chassi 4U. O D5-P5336 utiliza NAND QLC com firmware empresarial otimizado para desempenho de gravação sustentado e integridade de dados, o que é crucial neste caso, pois o sistema não lida com picos ocasionais de uso. Durante os períodos de pico de submissão, próximos às provas finais, ele simultaneamente processa vídeos, grava transcrições, registra os resultados das avaliações e atualiza o banco de dados.

Como documentamos em nossa reportagem sobre pesquisa oceânica abordando essa mesma configuração de hardware, os discos Solidigm em RAID 10 proporcionaram desempenho consistente de leitura e gravação sem ficar para trás no pipeline de processamento. O armazenamento não era o gargalo. A arquitetura expôs as reais limitações da carga de trabalho, permitindo que a equipe as otimizasse onde fosse necessário. Essa conclusão validada se aplica diretamente à implementação da avaliação acadêmica.

OSU como modelo para o ensino superior preparado para IA

A abordagem da Oregon State à infraestrutura de IA é deliberada e merece ser examinada como um modelo para outras instituições de ensino. Em vez de implantar ferramentas de IA de forma oportunista por meio de APIs na nuvem, a universidade tomou uma série de decisões arquitetônicas que tratam a IA como uma capacidade institucional duradoura, e não como um serviço de fornecedor. O hardware é padronizado em torno de plataformas que abrangem cargas de trabalho de computação acadêmica e de pesquisa. O armazenamento é local, de alta densidade e compatível desde a concepção. O corpo docente mantém a autoridade final sobre todas as avaliações produzidas pelo sistema.

Kalodimos é explícito ao afirmar que deseja que a plataforma ultrapasse os limites da OSU. "Nem todas as universidades terão os mesmos recursos que nós", disse ele. "Quero garantir que essa tecnologia esteja disponível para todas as universidades." Essa base é o que torna o argumento mais amplo em prol da equidade educacional crível. Um professor de uma instituição menor, com uma carga horária de ensino maior e menos recursos, provavelmente precisa dessa ferramenta mais do que ninguém.

"Preciso de armazenamento, e preciso que esse armazenamento seja rápido. A IA é uma tecnologia morta sem armazenamento. É um sistema orientado a dados. Tínhamos os algoritmos nas décadas de 1960 e 70. Não tínhamos os dados necessários porque não tínhamos armazenamento para guardar esses dados."

— Christopher Sullivan, Diretor de Pesquisa e Computação Acadêmica, Universidade Estadual do Oregon

Sullivan aborda a questão do planejamento de hardware da mesma forma que aborda todas as decisões de infraestrutura na OSU. Os modelos mudarão. Os tipos de contribuições dos alunos evoluirão. As técnicas de avaliação que o corpo docente deseja utilizar se tornarão mais sofisticadas. "Vou precisar de um garfo maior, uma faca maior ou uma colher maior", disse ele, "mas, no que diz respeito ao hardware, ainda serão garfo, faca e colher. Nos próximos anos, mudarei drasticamente os modelos e as contribuições, e, para mim, agora é mais importante que o hardware esteja sempre à frente dessas mudanças."

Cada transcrição processada, cada slide extraído, cada avaliação preliminar, cada nota aprovada e cada registro de auditoria precisam estar armazenados em algum lugar. Nesse sistema, há 245 TB de memória flash Solidigm QLC instalada localmente na infraestrutura da OSU, realizando o trabalho silencioso que torna possível a IA visível. O rack que Sullivan está planejando não será o último. A universidade está acompanhando os resultados deste projeto piloto, e outras instituições estarão atentas às ações da OSU. Isso é o que significa liderar em IA.

Envolva-se com a StorageReview

Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS feed

Brian Beeler

Brian está localizado em Cincinnati, Ohio e é analista-chefe e presidente da StorageReview.com.