Lorsque nous avons publié notre article sur Recherche sur l'imagerie du plancton à l'Université d'État de l'Oregon En novembre dernier, l'actualité était centrée sur la science : une infrastructure accélérée par l'IA à bord de navires de recherche traitait des téraoctets de données océaniques en quasi temps réel avant même l'arrivée du navire au port. Mais dans les semaines qui ont suivi, un autre phénomène, plus discret, s'est produit. La rumeur s'est répandue sur le campus : un simple serveur Dell PowerEdge XE7745, équipé de huit SSD Solidigm D5-P5336 E3.S et de cartes graphiques NVIDIA RTX PRO 6000, pouvait accomplir de telles performances. D'autres départements ont commencé à poser des questions, puis à passer des appels. Christopher Sullivan, directeur de la recherche et du calcul académique au sein du Collège des sciences de la Terre, de l'océan et de l'atmosphère de l'OSU, souhaite désormais acquérir une baie de ces serveurs pour répondre à la demande croissante en IA de l'université. Et les raisons de cette ambition vont bien au-delà du simple plancton.
L'Université d'État de l'Oregon s'est imposée comme l'une des universités les plus novatrices du pays en matière d'adoption de l'IA, tant pour la recherche que pour l'enseignement. Les décisions prises aujourd'hui sur le campus concernant l'infrastructure, ainsi que la mise en place de partenariats avec des entreprises telles que Metrum AI, Dell, NVIDIA et Solidigm, ne relèvent pas de simples expériences académiques. Elles jettent les bases d'une nouvelle approche universitaire pour dispenser un enseignement de qualité, évaluer les apprentissages et assurer la sécurité des étudiants. Voici l'histoire de l'élaboration de ce modèle.
Pendant des décennies, les travaux écrits ont joué un rôle central dans l'évaluation académique. Il suffisait de soumettre un devoir, de démontrer sa compréhension du sujet et d'obtenir une note. L'intelligence artificielle générative a profondément bouleversé ce système. Désormais, un étudiant peut rédiger une dissertation soignée et bien structurée sans s'investir réellement dans le sujet, et même les professeurs les plus expérimentés ne peuvent plus garantir son authenticité. La preuve d'une compréhension réelle, sur laquelle les universités s'appuyaient depuis des générations, s'est considérablement affaiblie.
L'alternative évidente est l'évaluation orale. On demande aux étudiants d'expliquer leur raisonnement à voix haute, de détailler leur analyse et de défendre leurs conclusions. Difficile de truquer cela. Le problème réside dans l'échelle. Un professeur enseignant à 200 étudiants ne peut pas s'asseoir face à chacun d'eux et mener un examen oral approfondi. Dans l'université moderne, cette contrainte a de facto relégué l'évaluation orale au second plan en tant qu'outil d'évaluation principal. Metrum AI a été conçu pour changer la donne.
IA MetrumFondée par le PDG Steen Graham et le directeur technique Chetan Gadgil, Metrum repose sur une conviction simple : l’IA doit être mise à contribution pour des tâches opérationnelles concrètes, et non se contenter de démontrer son potentiel. L’entreprise déploie des agents d’IA multimodaux capables d’analyser des vidéos, des fichiers audio, des documents et des données structurées pour des clients issus de secteurs aussi variés que l’assurance et l’industrie manufacturière. Metrum a développé un partenariat étroit avec Dell Technologies, validant ses plateformes sur l’infrastructure serveur d’entreprise de Dell, et ce, sur différentes configurations de GPU. Le système d’évaluation académique de l’Université d’État de l’Oregon ne constitue pas un simple changement de cap pour Metrum ; il s’agit de la même expertise fondamentale appliquée à un nouveau domaine, avec la même philosophie de conception sur site et centrée sur l’humain qui sous-tend tous les produits et services de l’entreprise.
Appliquée à l'évaluation académique, la plateforme traite les présentations vidéo enregistrées des étudiants grâce à une IA multimodale et fournit des évaluations préliminaires conformes à la grille d'évaluation, destinées à être examinées par les enseignants. L'objectif est clair : offrir aux enseignants un partenaire IA qui prend en charge les tâches d'extraction répétitives et fastidieuses afin qu'ils puissent se concentrer sur les décisions qui requièrent véritablement une expertise humaine.
Sur le plan fonctionnel, la plateforme réalise trois opérations. Elle extrait les données multimodales des vidéos soumises, génère des transcriptions audio horodatées grâce à OpenAI Whisper et capture le contenu des diapositives par analyse visuelle via Qwen3-VL-30B. Elle applique ensuite des grilles d'évaluation conçues par les enseignants au contenu extrait, à l'aide des modèles de raisonnement Qwen3-30B-A3B exécutés sur vLLM. Enfin, elle présente des évaluations préliminaires avec des indicateurs de preuves, en associant chaque note à un horodatage précis de la transcription ou à un identifiant de diapositive pour examen et approbation par le corps professoral avant toute transmission à l'étudiant.
Cette dernière étape est cruciale. Aucune note, aucun commentaire ni aucun retour d'information n'est visible pour les étudiants tant qu'un enseignant ne l'a pas examiné, modifié si nécessaire et approuvé explicitement. Le système repose sur l'autorité du corps professoral. De plus, la plateforme fonctionne entièrement sur site. Ce choix influence tous les aspects du fonctionnement du système, les personnes qui lui font confiance et le matériel requis.
Jonathan Kalodimos est professeur agrégé de finance et titulaire de la chaire Harley et Brigitte Smith à la faculté de commerce de l'Université d'État de l'Oregon. Son parcours est atypique pour quelqu'un au cœur de l'actualité des infrastructures d'IA. Avant de rejoindre l'OSU, il était économiste financier à la Securities and Exchange Commission (SEC) des États-Unis, où il a dirigé l'étude de la section 954 de la loi Dodd-Frank, qui a établi les règles relatives à la récupération des rémunérations des dirigeants. Ses travaux de recherche sur la gouvernance d'entreprise et la réglementation financière ont été cités dans le Wall Street Journal, le New York Times, Bloomberg et la Harvard Business Review. Il possède également, semble-t-il, un don pour la précision, digne d'un physicien.
Il y a environ un an, Kalodimos a développé un outil simple pour son cours de MBA : un agent d’IA capable d’évaluer la partie orale des présentations d’études de cas. Les étudiants ont été impressionnés par la qualité des retours. Il a présenté le projet lors de la Semaine de l’IA à l’Université d’État de l’Oregon. Dell l’a remarqué, l’a mis en relation avec Metrum AI, et une expérience menée en classe a pris une tout autre ampleur.
« Une fois que vous disposez de l’outil, vous pouvez affiner votre style et vos méthodes d’enseignement afin de tirer parti de ses atouts et d’offrir une meilleure expérience éducative. »
— Jonathan Kalodimos, professeur agrégé de finance et boursier Harley & Brigitte Smith, Université d'État de l'Oregon
Ce que Kalodimos met en place, c'est ce qu'il appelle l'extraction de connaissances fondée sur des preuves, sous-tendue par ce qu'il décrit comme l'ingénierie des grilles d'évaluation. Il s'agit de déterminer les éléments exploitables dans une présentation étudiante, de les regrouper en objectifs d'apprentissage et de fournir aux enseignants une vue structurée des points forts et des points faibles de chaque étudiant. « Pour expliquer cela aux étudiants sceptiques », dit-il, « c'est comme si j'avais une liste de contrôle très détaillée et que je passais en revue votre présentation en cochant les éléments abordés. C'est exactement ce que fait le système. Bien sûr, c'est beaucoup plus sophistiqué, mais cela me permet de voir toutes les occasions pour l'étudiant de démontrer sa maîtrise du sujet. »
Il a donné deux exemples illustrant les changements concrets apportés par le système. Dans le premier, un étudiant a condensé une présentation de dix minutes en cinq, parlant d'une voix monocorde et à un rythme tel qu'il maîtrisait mal l'anglais. Son élocution masquait totalement sa compréhension. « Même en écoutant attentivement », a expliqué Kalodimos, « je n'arrivais pas, ou ne voulais pas, analyser la présentation avec suffisamment de précision pour faire abstraction de l'élocution et me concentrer sur les éléments de preuve. » Lorsqu'il a ensuite examiné l'analyse des éléments de preuve générée par l'IA par tranches de quinze secondes, il est apparu clairement que l'étudiant avait compris le sujet. C'est la présentation qui avait été évaluée, et non la connaissance.
Le second cas concernait un étudiant qui avait construit sa présentation lentement, avec des diapositives apparemment décousues, et n'avait rassemblé son argumentation que sur la dernière diapositive. En direct, Kalodimos avait déjà une piètre opinion de la présentation. Le système a évalué le travail dans son ensemble et lui a attribué une bonne note. « Je n'aurais jamais imaginé que ce type d'évaluation présenterait un tel avantage », a-t-il déclaré. « On s'affranchit ainsi du critère du temps. »
Christopher Sullivan, directeur de la recherche et du calcul académique, est responsable de l'infrastructure pour ce déploiement. Son implication s'est intensifiée lorsqu'une lacune critique en matière de conformité est apparue dans la conception initiale de Metrum et Dell.
Lorsque Sullivan a pris en charge la mise en place de l'implémentation sur site de la plateforme Metrum à l'OSU, la première chose qu'il a identifiée était un problème que personne n'avait entièrement résolu : la loi FERPA (Family Educational Rights and Privacy Act).
La loi FERPA est la loi fédérale américaine qui régit les dossiers scolaires des élèves. Elle établit des exigences strictes concernant les personnes autorisées à accéder aux données des élèves, les conditions de cet accès et les mesures de protection à mettre en œuvre. Pour un système comme celui de Metrum, qui intègre les vidéos soumises par les élèves, génère des transcriptions, produit des évaluations et conserve l'historique complet de chaque décision d'évaluation, la conformité à la loi FERPA n'est pas une simple formalité ; c'est une contrainte architecturale.
« Nous devions disposer d'une solution sur site conforme à toutes les exigences de la loi FERPA », a déclaré Sullivan, « tout en bénéficiant d'une capacité de stockage importante. » Le traitement dans le cloud ne répondait pas à cette exigence. Acheminer les fichiers vidéo, les transcriptions audio et les évaluations des étudiants via des API d'IA externes aurait impliqué la transmission d'informations personnelles identifiables à des systèmes tiers hors du contrôle direct de l'université. La complexité contractuelle et technique du maintien de la conformité à la loi FERPA dans cet environnement, pour chaque fournisseur de la chaîne, a rendu cette solution inenvisageable.
Il y a aussi une dimension pratique liée à l'expérience étudiante. Les étudiants qui soumettent des présentations enregistrées offrent une expérience personnelle : leur voix, leur visage, leur raisonnement sous pression, parfois dans une langue qui n'est pas leur langue maternelle. Lorsqu'ils comprennent que leur vidéo est stockée sur un serveur de l'OSU, traitée par un modèle fonctionnant sur le matériel de l'OSU et soumise aux politiques de données de l'université, la donne change. Kalodimos a pu le constater directement lors du projet pilote. « L'idée qu'il s'agissait d'un modèle local avec un stockage local et que l'OSU soutenait les étudiants était palpable », a-t-il déclaré. « Nous devons absolument tirer parti de la confiance institutionnelle que l'OSU a su instaurer pour protéger nos étudiants et exploiter ces solutions sur site. »
Les plateformes d'IA dans le cloud sont faciles et rapides à déployer, mais elles exigent des établissements qu'ils fassent confiance à un contrat plutôt qu'à leur architecture. Pour les étudiants déjà méfiants quant à la gestion de leurs données, cette distinction peut fortement influencer leur décision d'adoption. Le déploiement sur site ne se limite pas à la conformité ; il instaure un climat de confiance.
Le projet pilote est en cours. Environ 500 étudiants, répartis dans plusieurs sections, soumettent leurs projets finaux à la fin de la semaine d'examens. Les évaluations notées doivent être rendues dans les quatre jours suivant la dernière soumission. Les rapports générés par l'IA doivent être disponibles avant que les enseignants ne commencent la correction. « Une intervention humaine est également en cours », a précisé Kalodimos, « mais les intervenants ont besoin du rapport en premier. Si le traitement de tous ces rapports prend deux jours, la charge de travail humaine sera encore plus réduite. » La pression est bien réelle, la date limite est fixée et l'infrastructure fonctionne correctement.
Le projet pilote a mis en lumière un autre point important. Lorsqu'un professeur a été promu à un poste administratif en cours de semestre, un enseignant a dû le remplacer au pied levé pour terminer le cours. L'existence d'un cadre d'évaluation par IA cohérent, avec des grilles d'évaluation définies et un processus de révision établi, a permis à cet enseignant d'assurer une continuité qui aurait autrement fait défaut. « Disposer d'un outil d'évaluation par IA fiable », a déclaré Kalodimos, « améliorera sans aucun doute l'expérience étudiante » précisément dans les situations où la continuité de l'enseignement humain ne peut être garantie.
L'affaire est finalement parvenue au doyen de l'OSU. Kalodimos a présenté l'ensemble de la solution : le système Dell, les performances de stockage Solidigm, les fonctionnalités pour les développeurs et les benchmarks d'infrastructure, lors d'une réunion qui devait durer dix minutes. Elle a finalement duré quarante minutes. Le doyen a ensuite envoyé un courriel au DSI, au directeur technique et à Sullivan. L'OSU prévoit désormais un déploiement à l'échelle de l'université afin de rendre cette ressource accessible aux professeurs dès le semestre de printemps. Cette ressource sera gérée par un nouveau bureau de calcul scientifique, rattaché au doyen et au bureau de la recherche.
Sullivan envisage ce déploiement sous l'angle d'une infrastructure à l'échelle du rack. La même plateforme XE7745 qui a servi de base aux travaux d'imagerie du plancton et qui alimente désormais le pipeline d'évaluation de l'IA de Metrum constitue l'infrastructure qu'il souhaite développer. L'objectif est de disposer d'un rack de ces serveurs, capables de basculer entre les charges de travail de calcul académique et de recherche en fonction des variations de la demande. Idéalement, les serveurs seraient dédiés au pipeline d'évaluation de Metrum lors des pics d'activité liés aux soumissions de mi-semestre et de fin de semestre, puis redéployés vers les charges de travail de recherche pendant les périodes plus calmes de l'année universitaire. « Nous pouvons prélever des machines de cet ensemble et les affecter temporairement au calcul académique, puis les récupérer et les utiliser pour le calcul de recherche », explique Sullivan. « Nous voulons pouvoir les redéployer instantanément. »
L'adoption spontanée est déjà en cours. Des professeurs de la Faculté des sciences de la santé et de la Faculté d'ingénierie ont contacté Kalodimos de manière indépendante après avoir entendu parler du projet par des voies informelles. La plateforme n'a pas fait l'objet d'une annonce officielle au-delà de la phase pilote. Elle a néanmoins trouvé son public.
Il existe une version de cette histoire qui ne concerne que l'accélération de la notation. C'est une vision incomplète.
La question plus détaillée porte sur la capacité des classes. Sullivan a décrit un cours de géologie de première année, un cours que l'OSU considère comme faisant partie intégrante de sa mission éducative et que chaque étudiant est censé suivre. Ce cours compte actuellement deux sections de 300 étudiants chacune, soit un total de 600 étudiants par trimestre. Les enseignants sont à pleine capacité. Ajouter des sections n'est pas envisageable compte tenu de leur charge de travail actuelle. « Je ne peux pas demander aux enseignants d'en faire plus », a déclaré Sullivan. « Je dois trouver des solutions pour créer davantage de sections en réduisant la charge de travail, ou pour augmenter le nombre d'étudiants dans les sections existantes. »
Kalodimos a également abordé la question de la Faculté de commerce. Les professeurs dont les groupes sont limités à 45 étudiants pour des raisons de sécurité incendie pourraient envisager des cours magistraux avec des salles de travail en petits groupes une fois l'évaluation individualisée déployable à grande échelle. « Il ne s'agit pas seulement de remplir les salles », a-t-il déclaré. « Il s'agit de maintenir la qualité tout en explorant différents modes d'enseignement. » C'est le système d'évaluation par intelligence artificielle qui rend possible l'évaluation individualisée à l'échelle d'un amphithéâtre.
« L’IA nous aide à augmenter les chiffres sans modifier l’impact, le message ou les enseignements tirés. »
— Christopher Sullivan, directeur de la recherche et de l'informatique académique, Université d'État de l'Oregon
Lorsque Sullivan a évalué les conditions nécessaires au déploiement du système Metrum sur site à l'OSU, en toute conformité avec la loi FERPA, la partie GPU était déjà définie. L'architecture de référence Metrum et Dell avait démontré que le XE7745 équipé de GPU NVIDIA RTX PRO 6000 pouvait gérer la charge de travail d'inférence à grande échelle. Le stockage restait cependant un point à résoudre.
La XE7745 est une plateforme 4U refroidie par air, optimisée pour une forte densité de GPU. Cette conception constitue son atout majeur, mais elle présente une contrainte de taille : le nombre de baies de disques est limité. « Je devais optimiser l'espace dans un seul appareil sans compromettre la vitesse », explique Sullivan, « car je ne voulais pas perdre tout le potentiel des GPU et de la XE7745. Or, il n'existait pas beaucoup de solutions SSD de grande capacité permettant d'atteindre cet objectif dans un format aussi compact. »
Dans un système de ce type, la couche de stockage gère bien plus que la simple charge de travail liée à l'IA. Les fichiers vidéo provenant du portail étudiant doivent être immédiatement mis en mémoire tampon. Les pistes audio extraites et les transcriptions horodatées sont stockées comme des fichiers distincts pour la relecture par le corps professoral. Les images des diapositives et les résultats de la reconnaissance optique de caractères (OCR) occupent une couche dédiée. La base de données Supabase, qui assure le suivi des métadonnées des soumissions, des évaluations des brouillons, des modifications apportées par le corps professoral et des enregistrements d'approbation, fonctionne en continu. Les pondérations des modèles Whisper, Qwen3-VL et du modèle de raisonnement doivent se charger suffisamment rapidement pour éviter les goulots d'étranglement dans l'inférence. Enfin, l'historique complet de chaque brouillon généré par l'IA, de chaque modification apportée par le corps professoral et de chaque action d'approbation doit être conservé sous forme d'enregistrement interrogeable à des fins d'accréditation, d'enquêtes sur l'intégrité académique et de rapports administratifs.
Chacune de ces charges de travail est stockée. Le GPU est responsable du rendu de l'IA. Le stockage assure l'alimentation et le fonctionnement continu du GPU.
L'équipe de Sullivan a choisi le Solidigm D5-P5336 au format E3.S. Le châssis XE7745 peut accueillir huit de ces disques. Avec une capacité de 30.72 To par disque, cela représente plus de 245 To de stockage flash dans un seul châssis 4U. Le D5-P5336 utilise de la mémoire NAND QLC avec un firmware d'entreprise optimisé pour des performances d'écriture soutenues et l'intégrité des données, un point crucial ici car le système ne gère pas de pics d'activité ponctuels. Lors des périodes de forte activité, notamment autour des examens finaux, il traite simultanément les vidéos, rédige les transcriptions, enregistre les résultats des évaluations et met à jour la base de données.
Comme nous l'avons documenté dans notre article sur la recherche océanographique portant sur cette même configuration matérielle, les disques Solidigm en RAID 10 ont offert des performances de lecture et d'écriture soutenues sans ralentir le traitement. Le stockage n'était pas le facteur limitant. L'architecture a mis en évidence les contraintes réelles de la charge de travail, permettant ainsi à l'équipe de les optimiser là où c'était nécessaire. Cette conclusion validée est directement applicable au déploiement pour l'évaluation académique.
L'approche de l'Université d'État de l'Oregon en matière d'infrastructure d'IA est réfléchie et mérite d'être étudiée comme modèle par d'autres établissements d'enseignement. Plutôt que de déployer des outils d'IA de manière opportuniste via des API cloud, l'université a fait des choix architecturaux qui considèrent l'IA comme une capacité institutionnelle pérenne et non comme un service externe. Le matériel est standardisé autour de plateformes couvrant les charges de travail de calcul pour la recherche et l'enseignement. Le stockage est sur site, haute densité et conforme aux normes dès sa conception. Le corps professoral conserve le pouvoir de décision final sur chaque évaluation produite par le système.
Kalodimos affirme clairement vouloir que la plateforme soit accessible au-delà de l'OSU. « Toutes les universités ne disposent pas des mêmes ressources que la nôtre », explique-t-il. « Je tiens à ce que cette technologie soit disponible pour toutes les universités. » C'est ce principe qui donne toute sa crédibilité à l'argumentaire plus large en faveur de l'équité en matière d'éducation. Un enseignant dans un établissement plus petit, avec une charge de travail plus importante et des ressources plus limitées, est sans doute celui qui a le plus besoin de cet outil.
« J'ai besoin de stockage, et j'ai besoin que ce stockage soit rapide. L'IA est une technologie morte sans stockage. C'est un système basé sur les données. Nous avions les algorithmes dans les années 1960 et 70. Nous n'avions pas de données pour les mettre en œuvre, car nous n'avions pas de stockage pour les conserver. »
— Christopher Sullivan, directeur de la recherche et de l'informatique académique, Université d'État de l'Oregon
Sullivan aborde la question de la planification du matériel de la même manière qu'il aborde chaque décision relative aux infrastructures à l'OSU. Les modèles évolueront. Les types de données fournies par les étudiants évolueront. Les techniques d'évaluation que les professeurs souhaiteront utiliser deviendront plus sophistiquées. « Je vais me procurer une fourchette, un couteau ou une cuillère plus grands », a-t-il déclaré, « mais en ce qui concerne le matériel, il s'agit toujours d'une fourchette, d'un couteau et d'une cuillère. Je vais modifier considérablement les modèles et les données d'entrée dans les années à venir, et il est plus important pour moi actuellement que le matériel reste en avance sur son temps. »
Chaque relevé de notes traité, chaque diapositive extraite, chaque évaluation provisoire, chaque note approuvée et chaque rapport d'audit doit être stocké quelque part. Dans ce système, 245 To de mémoire flash Solidigm QLC sont installés sur site au sein de l'infrastructure de l'OSU, effectuant le travail discret qui rend possible l'intelligence artificielle visible. Le rack que Sullivan prévoit d'installer ne sera pas le dernier. L'université observe attentivement les résultats de ce projet pilote, et d'autres établissements suivront de près les initiatives de l'OSU. C'est cela, être un chef de file en matière d'IA.
Bien que les serveurs Dell PowerEdge R4715 et R5715 soient deux produits distincts, ils doivent être considérés comme une matrice configurable. Cette matrice…
Le SSD NVMe 6600 ION de Micron atteint désormais 245.76 To, propulsant ainsi la gamme PCIe Gen5 QLC de l'entreprise, axée sur la capacité, dans la catégorie des quarts de pétaoctets. Micron…
La Radeon RX 9070 GRE n'est pas une nouvelle carte graphique. AMD l'a lancée l'année dernière exclusivement en Chine, et…
Les mises à jour de stockage se présentent généralement sous deux formes. Il y a la mise à niveau discrète, où un fournisseur intègre un nouveau processeur, affirme…
L'infrastructure de sauvegarde et de restauration a toujours été la partie du centre de données qui retient le plus l'attention lorsqu'un problème survient…
L'infrastructure de cyber-résilience occupe une place dans l'architecture d'entreprise que le stockage principal n'occupe pas. Lorsqu'un système tombe en panne…