Cuando publicamos nuestra historia en Investigación sobre imágenes de plancton de la Universidad Estatal de Oregón En noviembre pasado, la noticia principal fue la ciencia: infraestructura acelerada por IA a bordo de buques de investigación, procesando terabytes de datos oceánicos casi en tiempo real antes de que el barco llegara a puerto. Pero algo más sucedió discretamente en las semanas siguientes. Se corrió la voz en el campus sobre lo que un solo Dell PowerEdge XE7745 con ocho SSD Solidigm D5-P5336 E3.S y GPU NVIDIA RTX PRO 6000 podía lograr. Otros departamentos comenzaron a hacer preguntas. Luego comenzaron a hacer llamadas. Christopher Sullivan, director de Investigación e Informática Académica en la Facultad de Ciencias de la Tierra, el Océano y la Atmósfera de la OSU, ahora quiere un rack de estos servidores para satisfacer la creciente demanda de IA en toda la universidad, y la historia que impulsa esa ambición va mucho más allá del plancton.
La Universidad Estatal de Oregón se ha consolidado como una de las universidades más vanguardistas del país en la adopción de la IA tanto para la investigación como para la docencia. Las decisiones sobre infraestructura que se toman actualmente en el campus, junto con la creación de alianzas con empresas como Metrum AI, Dell, NVIDIA y Solidigm, no son meros experimentos académicos. Sientan las bases para una nueva forma en que las universidades imparten educación, evalúan el aprendizaje y protegen a sus estudiantes. Esta es la historia de cómo se desarrolló ese modelo.
El problema que la IA generativa agravó
Durante décadas, los trabajos escritos fueron fundamentales para la evaluación académica. Bastaba con entregar un trabajo, demostrar comprensión y obtener una calificación. La IA generativa ha transformado radicalmente este sistema. Ahora, un estudiante puede redactar un ensayo pulido y bien estructurado con poca familiaridad con el material, e incluso profesores experimentados no pueden determinar con certeza si se trata de un trabajo auténtico. La evidencia de comprensión genuina en la que las universidades se basaron durante generaciones se ha debilitado.
La alternativa obvia es la evaluación oral. Se pide a los estudiantes que expliquen su razonamiento en voz alta, que desarrollen su análisis y que defiendan sus conclusiones. Es difícil simularlo. El problema radica en la escala. Un profesor que imparte clases a 200 estudiantes no puede sentarse frente a cada uno y realizar un examen oral exhaustivo. En la universidad moderna, esta limitación ha relegado la evaluación oral como herramienta principal de evaluación. Metrum AI se creó para cambiar esta situación.
Lo que construyó Metrum AI
Inteligencia artificial de MetrumMetrum, cofundada por el CEO Steen Graham y el CTO Chetan Gadgil, se creó en torno a una convicción simple: la IA debe realizar trabajo operativo real, no solo demostrar su potencial. La empresa implementa agentes de IA multimodales que razonan sobre vídeo, audio, documentos y datos estructurados para clientes en industrias que van desde seguros hasta manufactura. Metrum ha desarrollado una estrecha colaboración con Dell Technologies, validando sus plataformas con la infraestructura de servidores empresariales de Dell en una variedad de configuraciones de GPU. El sistema de evaluación académica en la Universidad Estatal de Oregón no representa un cambio de rumbo para Metrum; es la misma capacidad subyacente aplicada a un nuevo dominio de problemas, con la misma filosofía de diseño local con intervención humana que rige todo lo que la empresa desarrolla.
Aplicada a la evaluación académica, la plataforma procesa las presentaciones en video grabadas de los estudiantes mediante IA multimodal y genera borradores de evaluación alineados con la rúbrica para su revisión por parte del profesorado. El objetivo es claro: brindar a los instructores un aliado de IA que se encargue del trabajo de extracción repetitivo y laborioso, para que puedan concentrarse en las decisiones que realmente requieren la intervención humana.
A nivel funcional, la plataforma realiza tres operaciones. Extrae artefactos multimodales de los vídeos enviados, genera transcripciones de audio con marca de tiempo mediante OpenAI Whisper y captura el contenido de las diapositivas mediante análisis visual con Qwen3-VL-30B. A continuación, aplica rúbricas diseñadas por el profesor al contenido extraído, utilizando modelos de razonamiento Qwen3-30B-A3B que se ejecutan en vLLM. Finalmente, presenta borradores de evaluaciones con indicadores de evidencia, vinculando cada puntuación a una marca de tiempo específica de la transcripción o a un identificador de diapositiva para su revisión y aprobación por parte del profesorado antes de que el material llegue al estudiante.
Ese último paso es crucial. Ninguna calificación, comentario o retroalimentación es visible para los estudiantes hasta que un instructor la haya revisado, realizado las modificaciones necesarias y la haya aprobado explícitamente. El sistema se basa en la autoridad del profesorado. Además, la plataforma funciona completamente en las instalaciones del cliente. Esta decisión influye en todos los aspectos del funcionamiento del sistema, quién confía en él y qué hardware requiere.
De proyecto paralelo de un profesor a mandato de un vicerrector.
Jonathan Kalodimos es profesor asociado de finanzas y titular de la cátedra Harley y Brigitte Smith en la Facultad de Negocios de la Universidad Estatal de Oregón. Su trayectoria profesional no es la que cabría esperar de alguien que se encuentra en el centro de la historia de la infraestructura de IA. Antes de incorporarse a la OSU, fue economista financiero en la Comisión de Bolsa y Valores de Estados Unidos (SEC), donde fue economista principal en el proyecto de la Sección 954 de la Ley Dodd-Frank, que estableció las normas relativas a la recuperación de bonificaciones a los ejecutivos. Sus investigaciones sobre gobierno corporativo y regulación financiera han sido citadas en The Wall Street Journal, The New York Times, Bloomberg y la Harvard Business Review. Además, resulta que posee una gran habilidad para medir con precisión, propia de un físico.
Hace aproximadamente un año, Kalodimos programó una herramienta sencilla para su clase de MBA: un agente de IA para evaluar la parte oral de las presentaciones de casos prácticos. Los estudiantes quedaron impresionados con la calidad de la retroalimentación. Presentó el proyecto durante la Semana de la IA en la Universidad Estatal de Oregón. Dell se fijó en él, lo puso en contacto con Metrum AI y lo que comenzó como un experimento en el aula se convirtió en algo mucho más grande.
“Una vez que disponga de la herramienta, podrá perfeccionar su estilo y sus métodos de enseñanza para aprovechar al máximo sus ventajas y ofrecer una mejor experiencia educativa.”
— Jonathan Kalodimos, Profesor Asociado de Finanzas y Becario Harley & Brigitte Smith, Universidad Estatal de Oregón
Lo que Kalodimos busca lograr es lo que él llama extracción basada en evidencia, sustentada en lo que describe como ingeniería de rúbricas. Esto implica determinar qué características se pueden extraer de la presentación de un estudiante, agrupar esas características en resultados de aprendizaje y proporcionar al profesorado una visión estructurada de dónde cada estudiante demostró comprensión y dónde tuvo dificultades. «La forma en que se lo explico a los estudiantes escépticos», dijo, «es como si tuviera una lista de verificación muy detallada y revisara su presentación marcando lo que hicieron; eso es lo que hace el sistema. Obviamente, es mucho más sofisticado que eso, pero me permite ver todas las oportunidades que tiene el estudiante para demostrar que conoce este material».
Ofreció dos ejemplos que ilustran los cambios que el sistema produce en la práctica. En el primero, un estudiante condensó una presentación de diez minutos en cinco, habló con un tono monótono y a un ritmo como si el inglés fuera su segundo idioma. Su forma de expresarse dificultó por completo la comprensión. «Aunque escuchaba con atención», dijo Kalodimos, «simplemente no podía, o no quería, analizarlo con ese nivel de detalle para superar la dificultad de la presentación y poder centrarme en la evidencia real». Cuando posteriormente revisó el análisis de la evidencia generado por la IA en intervalos de quince segundos, quedó claro que el estudiante sí comprendía el material. Lo que se había evaluado era la forma de expresarse, no el conocimiento.
El segundo caso involucró a un estudiante que construyó su presentación lentamente, con diapositivas aparentemente inconexas, y solo logró unificar su argumento en la última diapositiva. Al verla en directo, Kalodimos ya se había formado una opinión negativa de la presentación. El sistema evaluó el trabajo como un todo y le otorgó una buena calificación. «Ni siquiera pensé que ese sería un beneficio de este tipo de evaluación», dijo. «Se está dejando de lado el factor tiempo en la evaluación».
Christopher Sullivan, director de Investigación e Informática Académica, es el responsable de la infraestructura para la implementación. Su participación se intensificó cuando surgió una importante deficiencia en el cumplimiento normativo del diseño original de Metrum y Dell.
FERPA, soberanía de datos y por qué la nube no es la solución.
Cuando Sullivan intervino para construir la implementación local de la plataforma Metrum en la OSU, lo primero que identificó fue un problema que nadie había resuelto por completo: la Ley de Derechos Educativos y Privacidad Familiar (FERPA, por sus siglas en inglés).
FERPA es la ley federal que rige los expedientes académicos de los estudiantes. Establece requisitos estrictos sobre quién puede acceder a los datos de los estudiantes, bajo qué condiciones y cómo deben protegerse. Para un sistema como el de Metrum, que procesa videos de estudiantes, genera transcripciones, produce evaluaciones y almacena el historial completo de cada calificación, el cumplimiento de FERPA no es una simple casilla de verificación; es una restricción arquitectónica.
«Necesitábamos implementar una solución local que cumpliera con todos los requisitos de la ley FERPA», explicó Sullivan, «pero que además contara con una gran capacidad de almacenamiento». El procesamiento en la nube no era compatible con ese requisito. Enrutar los archivos de vídeo, las transcripciones de audio y los registros de evaluación de los estudiantes a través de API de IA externas implicaría transmitir información personal identificable de los estudiantes a sistemas de terceros ajenos al control directo de la universidad. La complejidad contractual y técnica de mantener el cumplimiento de la ley FERPA en ese entorno, con cada proveedor de la cadena, lo convirtió en una opción inviable.
También existe una dimensión práctica en la experiencia del estudiante. Los estudiantes que envían presentaciones grabadas ofrecen algo personal: su voz, su rostro, su razonamiento bajo presión, a veces en un idioma que no es su lengua materna. Cuando comprenden que su video se almacena en un servidor de la OSU, se procesa mediante un modelo que se ejecuta en hardware de la OSU y se rige por las propias políticas de datos de la OSU, la dinámica cambia. Kalodimos lo presenció directamente durante el programa piloto. «La idea de que se trataba de un modelo local con almacenamiento local y que la OSU respaldaba al estudiante», dijo, «era palpable. Realmente necesitamos aprovechar la confianza institucional que la OSU ha construido, protegiendo a nuestros estudiantes y utilizando estas soluciones locales».
Las plataformas de IA en la nube son fáciles y rápidas de implementar, pero requieren que las instituciones confíen en un contrato en lugar de en su arquitectura. Para los estudiantes que ya desconfían de cómo se gestionan sus datos, esta distinción puede influir significativamente en su disposición a adoptarlas. La implementación local no se trata solo de cumplimiento normativo; establece una base de confianza.
El piloto, el rector y lo que viene después en OSU
El programa piloto está en marcha. Aproximadamente 500 estudiantes de diversas secciones están entregando sus proyectos finales al término de la semana de exámenes. Las evaluaciones calificadas deben devolverse en un plazo de 4 días a partir de la última entrega. Los informes generados por IA deben estar listos antes de que el profesorado comience a calificar. «Hay un componente humano trabajando en paralelo», señaló Kalodimos, «pero necesitan el informe primero. Si se tardan dos días en procesar todo esto, entonces el factor humano se ve aún más presionado». La presión es real, la fecha límite es fija y la infraestructura está funcionando correctamente.
El programa piloto ha revelado otro aspecto importante. Cuando un profesor fue ascendido a un puesto administrativo a mitad de semestre, un instructor tuvo que intervenir con poca antelación y terminar el curso. Contar con un marco de evaluación de IA consistente, con rúbricas definidas y un flujo de trabajo de revisión establecido, le brindó a ese instructor una continuidad que de otro modo no habría existido. «Tener un sistema de evaluación de IA consistente», dijo Kalodimos, «sin duda mejorará la experiencia del estudiante» precisamente en aquellas situaciones en las que no se puede garantizar la continuidad de la enseñanza humana.
La historia finalmente llegó al vicerrector de la OSU. Kalodimos presentó el conjunto completo de soluciones: el sistema Dell, el rendimiento del almacenamiento Solidigm, las capacidades para desarrolladores y los puntos de referencia de la infraestructura, en lo que se suponía que sería una reunión de diez minutos. Se extendió durante cuarenta minutos. El vicerrector envió un correo electrónico al director de informática, al director de tecnología y a Sullivan. La OSU ahora planea una implementación a nivel universitario para que el recurso esté disponible para el profesorado a partir del semestre de primavera, gestionada por una oficina de Computación para la Investigación de reciente creación, que depende del vicerrector y de la oficina de investigación.
Sullivan está considerando esa implementación en términos de infraestructura a escala de rack. La misma plataforma XE7745 que sirvió de base para el trabajo de imágenes de plancton y que ahora impulsa el proceso de evaluación de Metrum AI es la base que desea escalar. El objetivo es un rack con estos servidores, disponibles para alternar entre cargas de trabajo de computación académica y de investigación según varíe la demanda. Idealmente, los servidores se dedicarían al proceso de evaluación de Metrum durante los picos de entrega de trabajos de mitad de semestre y finales, y se redistribuirían a cargas de trabajo de investigación durante los períodos más tranquilos del calendario académico. "Podemos tomar máquinas de ese conjunto y destinarlas a la computación académica durante un tiempo, y luego recuperarlas y aprovecharlas para la computación de investigación", dijo Sullivan. "Queremos poder redistribuirlas sobre la marcha".
La adopción orgánica ya está en marcha. Profesores de la Facultad de Ciencias de la Salud y de la Facultad de Ingeniería se han puesto en contacto con Kalodimos de forma independiente tras conocer el proyecto a través de canales informales. La plataforma no se ha anunciado formalmente más allá del programa piloto. Aun así, ha encontrado su público.
El problema de capacidad que subyace al problema de calificación
Existe una versión de esta historia que solo trata de acelerar las calificaciones. Esa es una visión incompleta.
La versión más extensa trata sobre la capacidad de las clases. Sullivan describió un curso de geología de nivel 100, una asignatura que la Universidad Estatal de Ohio (OSU) considera parte fundamental de su misión educativa y que todos los estudiantes deben cursar. Actualmente, se imparten dos secciones de 300 estudiantes cada una, para un total de 600 por trimestre. Los profesores están al límite de su capacidad. Añadir secciones no es viable dada la carga docente actual. «No puedo permitir que los profesores trabajen más», afirmó Sullivan. «Necesito encontrar soluciones para crear más secciones reduciendo la carga docente o para aumentar el número de estudiantes en las secciones que ya tenemos».
Kalodimos planteó de manera similar la dimensión de la Facultad de Negocios. Los profesores con secciones limitadas a 45 estudiantes por motivos de seguridad contra incendios tendrían la opción de explorar formatos de clases magistrales con apoyo de salas de grupos reducidos una vez que la evaluación individualizada pueda ampliarse. «No se trata solo de llenar el aula», dijo. «Se trata de mantener la calidad mientras se exploran diferentes modalidades de impartición». La capa de evaluación mediante IA es lo que hace que la evaluación individualizada a escala de aula sea operativamente posible.
“La IA nos está ayudando a aumentar las cifras sin alterar el impacto, el mensaje ni lo que se aprende.”
— Christopher Sullivan, Director de Investigación e Informática Académica, Universidad Estatal de Oregón
El almacenamiento era la pieza que faltaba.
Cuando Sullivan evaluó lo que se necesitaría para implementar el sistema Metrum en las instalaciones de OSU cumpliendo plenamente con la normativa FERPA, la parte de la GPU ya estaba definida. La arquitectura de referencia de Metrum y Dell había demostrado que el procesador XE7745 con GPU NVIDIA RTX PRO 6000 podía gestionar la carga de trabajo de inferencia a gran escala. Lo que quedaba por resolver era el almacenamiento.
La XE7745 es una plataforma 4U refrigerada por aire, optimizada para la densidad de GPU. Ese diseño es su punto fuerte, pero tiene una limitación importante: el número de bahías para unidades es limitado. «Necesitaba integrar mucho espacio en un solo equipo sin sacrificar la velocidad», dijo Sullivan, «porque no quería perder todo el valor de las GPU y todo lo que representaba la XE7745. Y realmente no había muchas soluciones SSD de gran capacidad en el mercado que lo lograran en un solo dispositivo».
La capa de almacenamiento en un sistema como este soporta más que la carga de trabajo principal de la IA. Los archivos de vídeo llegan desde el portal del estudiante y necesitan un lugar para almacenarlos inmediatamente. Las pistas de audio extraídas y las transcripciones con marca de tiempo se almacenan como artefactos discretos para la revisión del profesorado. Las imágenes de las diapositivas y la salida del OCR ocupan su propio nivel. La base de datos Supabase, que rastrea los metadatos de las presentaciones, las evaluaciones de borradores, las ediciones del profesorado y los registros de aprobación, se ejecuta continuamente. Los pesos del modelo para Whisper, Qwen3-VL y el modelo de razonamiento deben cargarse con la suficiente rapidez para evitar cuellos de botella en la inferencia. Además, el registro de auditoría completo de cada borrador generado por IA, cada anulación del profesorado y cada acción de aprobación debe conservarse como un registro consultable para las revisiones de acreditación, las investigaciones de integridad académica y los informes administrativos.
Cada una de esas cargas de trabajo reside en el almacenamiento. La GPU se lleva el mérito por el resultado de la IA. El almacenamiento mantiene la GPU alimentada y funcionando continuamente.
El equipo de Sullivan seleccionó el Solidigm D5-P5336 en formato E3.S. El XE7745 admite ocho de estas unidades. Con 30.72 TB por unidad, esto representa más de 245 TB de almacenamiento flash en un único chasis 4U. El D5-P5336 utiliza memoria NAND QLC con firmware empresarial optimizado para un rendimiento de escritura sostenido e integridad de datos, lo cual es importante en este caso, ya que el sistema no maneja picos de carga ocasionales. Durante los períodos de mayor actividad de entrega de trabajos, cerca de los exámenes finales, simultáneamente procesa videos, escribe transcripciones, registra los resultados de la evaluación y actualiza la base de datos.
Como documentamos en nuestro artículo sobre investigación oceanográfica que analizaba esta misma configuración de hardware, las unidades Solidigm en RAID 10 ofrecieron un rendimiento sostenido de lectura y escritura sin quedarse atrás en el procesamiento. El almacenamiento no fue el cuello de botella. La arquitectura puso de manifiesto las limitaciones reales de la carga de trabajo, lo que permitió al equipo optimizarlas en los aspectos clave. Esta conclusión, validada, se traslada directamente a la implementación de la evaluación académica.
La Universidad Estatal de Ohio como modelo para una educación superior preparada para la IA.
El enfoque de la Universidad Estatal de Oregón respecto a la infraestructura de IA es deliberado y merece ser analizado como modelo para otras instituciones educativas. En lugar de implementar herramientas de IA de forma oportunista mediante API en la nube, la universidad ha tomado una serie de decisiones arquitectónicas que consideran la IA como una capacidad institucional sólida, en lugar de un servicio externo. El hardware está estandarizado en torno a plataformas que abarcan cargas de trabajo de investigación y computación académica. El almacenamiento es local, de alta densidad y cumple con las normativas desde su diseño. El profesorado conserva la autoridad final sobre cada evaluación que produce el sistema.
Kalodimos es explícito en su deseo de que la plataforma trascienda las fronteras de la Universidad Estatal de Ohio (OSU). «No todas las universidades contarán con los mismos recursos que la nuestra», afirmó. «Quiero asegurarme de que esta tecnología esté disponible para todas las universidades». Esta premisa es la que da credibilidad al argumento general a favor de la equidad educativa. Un profesor de una institución más pequeña, con una mayor carga docente y menos recursos, es sin duda quien más necesita esta herramienta.
Necesito almacenamiento, y necesito que sea rápido. La IA es una tecnología muerta sin almacenamiento. Es un sistema basado en datos. Ya teníamos los algoritmos en los años 1960 y 70. No teníamos datos para usarlos porque no teníamos almacenamiento para guardar esos datos.
— Christopher Sullivan, Director de Investigación e Informática Académica, Universidad Estatal de Oregón
Sullivan plantea la cuestión de la planificación del hardware del mismo modo que plantea todas las decisiones de infraestructura en la OSU. Los modelos cambiarán. Los tipos de información que aportan los estudiantes evolucionarán. Las técnicas de evaluación que el profesorado quiere utilizar se volverán más sofisticadas. «Voy a necesitar herramientas más avanzadas», dijo, «pero en lo que respecta al hardware, seguirá siendo lo mismo. Voy a modificar drásticamente los modelos y los datos de entrada en los próximos años, y ahora mismo lo más importante para mí es que el hardware se mantenga a la vanguardia».
Cada transcripción procesada, cada diapositiva extraída, cada borrador de evaluación, cada calificación aprobada y cada registro de auditoría deben almacenarse en algún lugar. En este sistema, hay 245 TB de memoria flash Solidigm QLC en las instalaciones de la OSU, realizando el trabajo silencioso que hace posible la IA visible. El rack que Sullivan está planificando no será el último. La universidad está observando los resultados de este proyecto piloto, y otras instituciones observarán lo que haga la OSU. Eso es lo que significa liderar en IA.




Amazon