StorageReview.com

Inteligencia Artificial en el Mar: La Universidad Estatal de Oregón zarpa para estudiar el océano en tiempo real.

AI  ◇  Empresa

“Nos interesan las tecnologías que transforman la ciencia.”

— Christopher Sullivan, Director – Investigación e Informática Académica – Facultad de Ciencias de la Tierra, el Océano y la Atmósfera – Universidad Estatal de Oregón

At Laboratorio de Ecología del Plancton de la Universidad Estatal de Oregón, ubicado dentro del Centro de Ciencias Marinas HatfieldLa conversación sobre infraestructura comienza con un objetivo científico: ¿Cómo puede la tecnología ayudar a los investigadores a comprender mejor y más rápido nuestros océanos, preservando a la vez cada dato único que recopilan en el mar? La respuesta depende cada vez más de la capacidad de cómputo, la aceleración por GPU y el almacenamiento NVMe de alta densidad, al servicio de la ciencia, y no al revés.

El laboratorio estudia los fundamentos de la red trófica marina mediante la captura de imágenes de alta resolución y telemetría ambiental, transformando esos datos en información valiosa. Este trabajo no es abstracto; se trata de ciencia de campo que depende de barcos, sensores y ventanas de tiempo irrepetibles. Perder datos no es un inconveniente, sino la pérdida de un instante en el océano que jamás volverá.

Dell PowerEdge XE7745

Para responder a las grandes preguntas científicas se necesita hardware robusto. Hemos estado trabajando codo a codo con la Universidad Estatal de Ohio (OSU) en la validación de un Dell PowerEdge XE7745 que combina GPU con SSD NVMe de alta densidad, lo que permite a los investigadores analizar, conservar y compartir datos sin comprometer la integridad. Se prioriza la integridad y la fiabilidad, seguidas de la velocidad a gran escala. Así es como la tecnología transforma la práctica científica mediante la IA, más allá de la teoría.

Dentro del sistema

  • Servidor: Dell PowerEdge XE7745 (4U)
  • procesadores: Procesador dual AMD EPYC 9555 de 64 núcleos
  • DRACMA: 24 x 32 GB – 768 GB
  • GPU: 4 × Servidor NVIDIA RTX Pro 6000
  • Almacenamiento: 8 × Solidigm D5-P5336 E3.S 30.72 TB
  • Networking: Descarga de Ethernet de 100 Gb

“Toda tecnología ya introduce sesgos en la ciencia. El reto consiste en encontrar tecnología que elimine esas limitaciones.”

El plancton es el arquitecto invisible de la vida en la Tierra. Estos organismos microscópicos impulsan el motor biológico del planeta, produciendo aproximadamente la mitad del oxígeno mundial y constituyendo la base de todas las redes tróficas marinas. Absorben enormes cantidades de dióxido de carbono, influyen en los ciclos climáticos globales y sirven como indicadores tempranos de los cambios en los ecosistemas. Comprender el plancton implica comprender la salud del océano, su papel en la regulación de la atmósfera y, en última instancia, la estabilidad futura del planeta.

Investigación oceánica con IA sobre plancton

Zooplancton, Crédito de la imagen: Matt Wilson/Jay Clark, NOAA NMFS AFSC.

Durante décadas, la investigación del plancton se basó en redes que recolectaban muestras masivas, las cuales se analizaban posteriormente al microscopio. Estos métodos solo proporcionaban imágenes estáticas y a menudo llevaban a la suposición errónea de que depredadores y presas interactuaban constantemente en la misma región de la columna de agua. Los sistemas de imágenes de alta resolución, capaces de desplazarse verticalmente por el océano, revelaron una realidad distinta. Muchas especies de plancton y sus depredadores ocupan capas diferenciadas, separadas por gradientes de profundidad, temperatura y nutrientes. Esta estructura era invisible hasta ahora. Las técnicas modernas de imagen permiten a los investigadores observar no solo la presencia de las especies, sino también su distribución, sus interacciones y cómo estas evolucionan.

Sistema de imágenes de ictioplancton in situ (ISIIS), Crédito de la imagen: Universidad Estatal de Oregón

La OSU cuenta con muchas herramientas para el estudio del plancton, pero su instrumento principal es el Sistema de imágenes de ictioplancton in situ (ISIIS)ISIIS es una plataforma remolcada que se desplaza por el océano, enviando información a través de un cable oceanográfico de cobre y fibra óptica. Dos cámaras 8K capturan siluetas del plancton a medida que el agua de mar fluye por el sistema, registrando imágenes de hasta 160 litros por segundo y, al mismo tiempo, datos de temperatura, salinidad y profundidad para contextualizar la situación.

Este proceso genera terabytes de datos cada día. Los científicos de la OSU quieren analizarlos casi en tiempo real para que las tripulaciones de los barcos puedan ajustar sus rutas de muestreo en función de lo que vean bajo la superficie.

La visión a largo plazo es permitir que los modelos de IA identifiquen automáticamente organismos y detecten cambios en las poblaciones de plancton que podrían presagiar cambios ambientales de mayor envergadura. Captar estos patrones a gran escala requiere tanto sistemas de imagen avanzados como la infraestructura computacional capaz de transformar el caos visual en información cuantificable.

Actualmente, el trabajo de validación de la Universidad Estatal de Oregón se realiza en tierra, donde el sistema Dell PowerEdge XE7745 procesa los inmensos conjuntos de imágenes recopilados por la plataforma ISIIS. Este entorno permite a los investigadores perfeccionar sus modelos, verificar la integridad de los datos y evaluar el rendimiento del sistema bajo cargas de trabajo científicas. El objetivo a largo plazo es trasladar esta capacidad a alta mar, integrando la misma arquitectura de computación y almacenamiento a bordo de buques de investigación para que los datos puedan procesarse y analizarse directamente en el mar. Este cambio de la validación en laboratorio al despliegue en tiempo real en el océano es lo que, en última instancia, cerrará el ciclo entre la recopilación de datos, el análisis y el descubrimiento.

“Nuestro flujo de trabajo ideal es que, cuando el barco llegue a puerto, el trabajo científico ya esté hecho.”

La siguiente fase de la infraestructura de investigación de la Universidad Estatal de Oregón lleva la computación directamente a los mares. La nueva flota de buques de investigación de la universidad, que incluye los próximos... Buques de investigación de clase regional como el Buque de investigación TaaniSe está diseñando como una plataforma para la recopilación y el análisis de datos semiautónomos de alto rendimiento. Estos buques servirán como laboratorios móviles, equipados con instrumentación científica, conjuntos de sensores y, ahora, sistemas informáticos con GPU capaces de analizar terabytes de datos antes de regresar a tierra.

Buque de investigación de clase regional R/V Taani

Crédito de la imagen de renderizado 3D del barco: Universidad Estatal de Oregón

Cada viaje albergará múltiples experimentos simultáneos, desde imágenes de plancton y monitoreo digital de la pesca hasta mapeo acústico y modelado ambiental. El desafío en alta mar no reside en la potencia, sino en la densidad. Cada unidad de rack a bordo del buque debe ofrecer el máximo rendimiento con la mínima complejidad, dado el limitado personal de soporte informático disponible. La configuración validada del Dell PowerEdge XE7745 con SSD Solidigm E3.S y GPU NVIDIA RTX Pro 6000 se está evaluando como pilar fundamental de esta estrategia de centro de datos a bordo de buques. Al procesar datos prácticamente en tiempo real, los investigadores de la OSU pueden ajustar las rutas de muestreo, detectar anomalías y tomar decisiones científicas fundamentadas incluso durante la travesía.

Imágenes segmentadas de plancton, Fuente: Universidad Estatal de Oregón

Este enfoque también permite la integración de la inteligencia artificial en el flujo de trabajo. Los modelos de IA entrenados con imágenes históricas de plancton pueden clasificar organismos, identificar tendencias ambientales e incluso predecir dónde es probable que aparezcan altas concentraciones de las especies objetivo. Esta capacidad transforma una expedición de investigación, pasando de ser una misión pasiva de recopilación de datos a un esfuerzo de exploración activo y adaptativo. Al combinarlo con almacenamiento NVMe fiable y redundante y redes de alta velocidad, se obtiene un entorno de computación perimetral resiliente, diseñado específicamente para el descubrimiento.

La visión es convertir cada buque de investigación de la OSU en un observatorio autónomo con inteligencia artificial. Los datos recopilados por los instrumentos del barco se transmitirán directamente a los clústeres de computación a bordo, donde se analizarán, archivarán y descargarán a través de conexiones Ethernet de 100 Gb cuando el barco regrese a puerto. Para cuando el buque atraque, los científicos ya contarán con información práctica, resultados validados y la certeza de que ni un solo byte de datos se perdió en el mar.

“Cuando se recopilan datos ambientales en el mar, cada hora cuesta miles de dólares.”

Los datos recopilados a bordo de los buques de investigación de la Universidad Estatal de Oregón se encuentran entre la información más valiosa de la comunidad científica. Cada minuto de operación representa tiempo de barco, combustible, tripulación y equipo trabajando en conjunto para capturar condiciones que tal vez nunca se repitan. Perder siquiera una fracción de esos datos no es una opción. El equipo de Sullivan diseñó su infraestructura en torno a un principio fundamental: cada dato debe preservarse, verificarse y analizarse antes de que el barco regrese al muelle.

Para lograr ese objetivo, OSU está validando la Dell PowerEdge XE7745, una plataforma 4U refrigerada por aire diseñada para cargas de trabajo aceleradas por GPU. Este sistema combina dos procesadores AMD EPYC con hasta ocho (cuatro en este caso). GPU para servidores NVIDIA RTX Pro 6000 Basadas en la arquitectura Blackwell, cada GPU ofrece 96 GB de memoria GDDR7 de alta velocidad y núcleos tensoriales avanzados, diseñados específicamente para la inferencia de IA y el procesamiento de imágenes, lo que permite a los investigadores analizar datos ambientales de alta resolución en tiempo real.

Las limitadas bahías para unidades del XE7745 hicieron que la capacidad por ranura fuera un factor determinante, lo que llevó a OSU a integrar ocho Unidades SSD Solidigm D5-P5336 E3.S de 30.72 TBEsto ofrece casi 250 TB de almacenamiento flash en un formato compacto, combinando la eficiencia de la memoria NAND QLC de Solidigm con firmware empresarial optimizado para un rendimiento de escritura sostenido y la integridad de los datos. Para el buque de investigación Taani, donde el espacio y la refrigeración son cruciales, esta densidad permite que toda la plataforma, el sistema de cómputo, la aceleración por GPU y el almacenamiento redundante quepan en un único chasis 4U.

“Estamos probando a fondo estos sistemas para ver hasta dónde pueden llegar.”

La fase de validación en la Universidad Estatal de Oregón se centra en comprender la eficacia con la que el Dell PowerEdge XE7745 admite el flujo de trabajo completo de obtención de imágenes de plancton de principio a fin. El objetivo no es solo medir la velocidad, sino confirmar que el sistema puede procesar datos de forma fiable a la escala y al ritmo exigidos durante las operaciones a bordo de los buques.

Actualmente, el laboratorio captura más de 15 terabytes de imágenes y datos ambientales al día durante una operación de investigación típica. Con la plataforma XE7745, el equipo procesa alrededor de dos terabytes de vídeo sin procesar al día. Este flujo de trabajo utiliza 256 núcleos de CPU para la segmentación y cuatro GPU NVIDIA RTX Pro 6000 Server para la inferencia. El resultado es un proceso aproximadamente tres veces más rápido que el de la generación anterior.

El hallazgo más notable es que el cuello de botella actual reside en la segmentación de la CPU, no en el rendimiento del almacenamiento ni en el procesamiento de la GPU. Las unidades SSD Solidigm D5-P5336 en RAID 10 ofrecen un rendimiento de lectura y escritura sostenido de forma constante, sin retrasarse con respecto al flujo de procesamiento. Las GPU también mantienen un margen de rendimiento, lo que permite opciones de escalado horizontal en función de la disponibilidad de energía y refrigeración. En otras palabras, el hardware ya no es el factor limitante. La arquitectura ahora expone la carga de trabajo científica real, lo que permite al equipo ajustar la etapa de segmentación con precisión.

Solidigm p5336 para la investigación oceánica con IA

Unidades SSD Solidigm P5336 de 30.72 TB

El impacto operativo es significativo. En expediciones anteriores, los investigadores solo podían observar la transmisión de video a medida que se recopilaba, sin poder confirmar si estaban muestreando agua rica en plancton o simplemente capturando partículas en suspensión. El plancton sigue las corrientes y a menudo se concentra en capas sutiles que no son visibles en tiempo real. Sin procesamiento, una expedición de diez días podría generar horas de datos con escaso valor científico útil.

Gracias al procesamiento casi en tiempo real del XE7745, el equipo científico puede evaluar la calidad de los datos durante su recopilación. Si las imágenes muestran escasa presencia de plancton, el barco puede cambiar de profundidad o desplazarse a nuevas coordenadas sin salir del mar. Esta capacidad de realizar ajustes precisos es una de las razones principales por las que la computación acelerada por IA tiene cabida en los buques de investigación. Transforma la expedición, pasando de la mera captura pasiva de datos a la exploración científica activa.

A medida que se incorporan más sistemas XE7745, la capacidad de procesamiento puede ampliarse para gestionar el volumen total de datos diarios. Esta ampliación se equilibra con las limitaciones físicas de la investigación a bordo de buques: consumo energético, extracción de calor y densidad de racks. Estos desafíos no son tecnológicos, sino ambientales, y ahora son visibles precisamente porque la plataforma informática ha demostrado ser capaz de mantenerse al día.

“Si tu tecnología puede cambiar la ciencia, hablemos.”

El conocimiento científico avanza cuando logramos ver lo que antes estaba oculto, y los océanos están repletos de estos secretos. Los sistemas de imagenología de la Universidad Estatal de Oregón están revelando especies de plancton poco comunes que desempeñan un papel fundamental en la cadena alimentaria marina, a la vez que demuestran cómo los cambios ambientales, como el aumento de la temperatura del océano, afectan su supervivencia. El plancton responde rápidamente al estrés, lo que lo convierte en un indicador temprano de cambios importantes en los sistemas oceánicos y climáticos. Su estudio detallado es esencial para comprender cómo el océano sustenta la vida y cómo ese equilibrio puede estar cambiando.

Este progreso depende de herramientas que evolucionan en respuesta a las preguntas científicas. La investigación moderna requiere la capacidad de recopilar, procesar e interpretar conjuntos de datos masivos en los entornos donde se generan. El almacenamiento NVMe de gran capacidad y la aceleración por GPU permiten ahora que el procesamiento se realice más cerca del punto de captura de datos, en lugar de depender exclusivamente de centros de datos centralizados. Para OSU, esto significa análisis en tiempo real o casi real en el borde de la red, donde las decisiones científicas pueden influir en el propio proceso de recopilación de datos.

Investigación oceánica con IA: Savana Stallsmith con servidor GPU

Savana Stallsmith, estudiante de la Universidad Estatal de Oregón, utiliza el pipeline de IA de Plankton.

La colaboración entre la Universidad Estatal de Oregón y sus socios tecnológicos refleja una comprensión compartida de las metas y los objetivos. Los límites de la investigación no radican en las preguntas que se plantean, sino en las respuestas que se ofrecen. Estos límites se definen por la capacidad práctica de procesar el volumen de información que proporciona el océano. Cuando el diseño de la computación, el almacenamiento y el flujo de trabajo se alinea con las necesidades científicas, las limitaciones comienzan a desaparecer.

De cara al futuro, la oportunidad reside en diseñar sistemas que capturen, analicen y comprendan los datos sin necesidad de transferirlos entre múltiples plataformas. El procesamiento se realiza en la dirección de los datos, y no al revés. Los clústeres de computación a bordo de buques, el almacenamiento NVMe de alta densidad y la inferencia acelerada por GPU son pasos hacia ese modelo. Esto no es una mera aspiración a la IA. Este proyecto demuestra que ya se está produciendo un cambio significativo en la computación para la investigación.

El océano está cambiando. Los datos son cruciales. El tiempo para comprenderlo es limitado. El trabajo realizado en la Universidad Estatal de Oregón demuestra lo que se puede lograr cuando aplicamos la tecnología adecuada a las preguntas correctas, en el momento preciso y en los lugares donde se desarrolla la investigación científica.

Obtenga más información sobre la investigación de la Universidad Estatal de Oregón en SC25:

Charla de Dell Technologies
Fecha: martes 18/11
Tiempo: 11: 30 am
Ubicación: Área de charlas del stand principal de Dell

Charla sobre supermicro
Fecha: miércoles 11/19
Tiempo: 5: 00 pm
Ubicación: Stand principal de Supermicro n.° 3504

Interactuar con StorageReview

Boletín informativo | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS Feed

Brian Beeler

Brian se encuentra en Cincinnati, Ohio y es el analista jefe y presidente de StorageReview.com.