ArmazenamentoReview.com

Inteligência Artificial no Mar: A Universidade Estadual do Oregon embarca para estudar o oceano em tempo real.

AI  ◇  Empreendimento

“Nós nos importamos com tecnologias que transformam a ciência.”

— Christopher Sullivan, Diretor – Computação Acadêmica e de Pesquisa – Faculdade de Ciências da Terra, Oceano e Atmosfera – Universidade Estadual do Oregon

At Laboratório de Ecologia do Plâncton da Universidade Estadual do Oregon, localizado dentro do Centro de Ciências Marinhas de HatfieldA discussão sobre infraestrutura começa com um objetivo científico. Como a tecnologia pode ajudar os pesquisadores a entender nossos oceanos melhor e mais rapidamente, preservando cada dado único coletado no mar? A resposta depende cada vez mais de computação, aceleração por GPU e armazenamento NVMe de alta densidade, trabalhando a serviço da ciência, e não o contrário.

O laboratório estuda os fundamentos da cadeia alimentar marinha capturando imagens de alta resolução e telemetria ambiental, transformando esses dados em conhecimento. Esse trabalho não é abstrato. É ciência de campo que depende de navios, sensores e janelas de tempo que não podem ser recriadas. Perder dados não é um mero inconveniente. É a perda de um momento no oceano que jamais retornará.

Dell PowerEdge XE7745

Responder a grandes questões científicas exige hardware robusto. Temos acompanhado de perto a OSU (Universidade Estadual de Ohio) na validação de um Dell PowerEdge XE7745 que combina GPUs com SSDs NVMe de alta densidade, permitindo que pesquisadores analisem, preservem e compartilhem dados sem comprometer a qualidade. A ênfase é na integridade e confiabilidade em primeiro lugar, seguidas pela velocidade em larga escala. É assim que a tecnologia transforma a prática científica por meio da IA, e não apenas na teoria.

Dentro do Sistema

  • Servidor: Dell PowerEdge XE7745 (4U)
  • processadores: Processador duplo AMD EPYC 9555 de 64 núcleos
  • DRAMs: 24x32GB – 768GB
  • GPUs: 4 × Servidor NVIDIA RTX Pro 6000
  • Armazenamento: 8 × Solidigm D5-P5336 E3.S 30.72 TB
  • Networking: Descarregamento de Ethernet de 100 Gb

“Toda tecnologia já influencia a ciência. O desafio é encontrar uma tecnologia que elimine essas limitações.”

O plâncton é o arquiteto invisível da vida na Terra. Esses organismos microscópicos impulsionam o motor biológico do planeta, produzindo aproximadamente metade do oxigênio mundial e formando a base de todas as cadeias alimentares marinhas. Eles absorvem quantidades enormes de dióxido de carbono, influenciam os ciclos climáticos globais e servem como indicadores precoces de mudanças nos ecossistemas. Compreender o plâncton significa compreender a saúde do oceano, seu papel na regulação da atmosfera e, em última análise, a estabilidade futura do planeta.

plâncton de pesquisa oceânica de IA

Zooplâncton. Crédito da imagem: Matt Wilson/Jay Clark, NOAA NMFS AFSC.

Durante décadas, a pesquisa sobre plâncton baseou-se em redes que coletavam amostras em grande quantidade, as quais eram então analisadas ao microscópio. Esses métodos produziam apenas instantâneos e frequentemente levavam à suposição de que predadores e presas interagiam constantemente na mesma região da coluna d'água. Sistemas de imagem de alta resolução, capazes de se mover verticalmente pelo oceano, revelaram um panorama diferente. Muitas espécies de plâncton e seus predadores ocupam camadas distintas, separadas por gradientes de profundidade, temperatura e nutrientes. Essa estrutura era invisível antes. As técnicas modernas de imagem permitem aos pesquisadores observar não apenas a presença das espécies, mas também sua distribuição, interações e como essas interações evoluem.

Sistema de Imagem de Ictioplâncton In Situ (ISIIS), Crédito da Imagem: Universidade Estadual do Oregon

A OSU possui muitas ferramentas para estudar o plâncton, mas seu principal instrumento é o Sistema de Imagem de Ictioplâncton In Situ (ISIIS)O ISIIS é uma plataforma rebocada que viaja pelo oceano, enviando informações por meio de cabos oceanográficos de cobre/fibra óptica. Duas câmeras 8K capturam silhuetas de plâncton à medida que a água do mar flui pelo sistema, registrando até 160 litros por segundo e coletando dados de temperatura, salinidade e profundidade para contextualização.

Esse processo gera terabytes de dados todos os dias. Os cientistas da OSU querem analisá-los em tempo quase real para que as tripulações dos navios possam ajustar suas rotas de amostragem com base no que observam abaixo da superfície.

A visão a longo prazo é permitir que modelos de IA identifiquem automaticamente organismos e detectem mudanças nas populações de plâncton que possam prenunciar alterações ambientais mais amplas. Capturar esses padrões em grande escala exige tanto sistemas de imagem avançados quanto infraestrutura computacional capaz de transformar o caos visual em informações quantificáveis.

Atualmente, o trabalho de validação da Universidade Estadual do Oregon ocorre em terra, onde o sistema Dell PowerEdge XE7745 processa os imensos conjuntos de imagens coletados pela plataforma ISIIS. Esse ambiente permite que os pesquisadores refinem seus modelos, verifiquem a integridade dos dados e avaliem o desempenho do sistema sob cargas de trabalho científicas. O objetivo a longo prazo é levar essa capacidade para o mar, incorporando a mesma arquitetura de computação e armazenamento a bordo de navios de pesquisa, para que os dados possam ser processados ​​e analisados ​​ainda em alto-mar. Essa transição da validação em laboratório para a implantação em tempo real no oceano é o que, em última análise, fechará o ciclo entre coleta de dados, análise e descoberta.

“O nosso fluxo de trabalho ideal é que, quando o navio chegar ao porto, a pesquisa científica já esteja concluída.”

A próxima fase da infraestrutura de pesquisa da Universidade Estadual do Oregon leva a computação diretamente para o mar. A nova frota de navios de pesquisa da universidade, incluindo os próximos navios, inclui... Navios de pesquisa de classe regional como o R/V TaaniEstá sendo projetado como uma plataforma para coleta e análise de dados semiautônoma de alto desempenho. Esses navios servirão como laboratórios móveis, transportando instrumentação científica, conjuntos de sensores e, agora, sistemas de computação baseados em GPUs capazes de analisar terabytes de dados antes mesmo de retornar à costa.

Navio de Pesquisa de Classe Regional R/V Taani

Renderização 3D do navio Crédito da foto: Universidade Estadual do Oregon

Cada viagem abrigará múltiplos experimentos simultâneos, desde imagens de plâncton e monitoramento digital da pesca até mapeamento acústico e modelagem ambiental. O desafio no mar não é a potência, mas a densidade. Cada unidade de rack a bordo da embarcação deve oferecer o máximo desempenho com a mínima complexidade, dada a equipe de suporte de TI limitada no mar. A configuração validada do Dell PowerEdge XE7745 com SSDs E3.S da Solidigm e GPUs NVIDIA RTX Pro 6000 está sendo avaliada como a base dessa estratégia de data center embarcado. Ao processar dados em tempo quase real, os pesquisadores da OSU podem ajustar rotas de amostragem, detectar anomalias e tomar decisões científicas embasadas enquanto ainda estão em alto mar.

Imagens segmentadas de plâncton, Fonte: Universidade Estadual do Oregon

Essa abordagem também permite a integração da inteligência artificial ao fluxo de trabalho. Modelos de IA treinados com imagens históricas de plâncton podem classificar organismos, identificar tendências ambientais e até mesmo prever onde altas concentrações de espécies-alvo provavelmente aparecerão. Essa capacidade transforma uma expedição de pesquisa de uma missão passiva de coleta de dados em um esforço de exploração ativo e adaptativo. Quando combinada com armazenamento NVMe confiável e redundante e redes de alta velocidade, o resultado é um ambiente de computação de borda resiliente, projetado especificamente para descobertas.

A visão é transformar cada navio de pesquisa da OSU em um observatório autossuficiente e equipado com inteligência artificial. Os dados coletados pelos instrumentos do navio fluirão diretamente para clusters de computação a bordo, onde poderão ser analisados, arquivados e transferidos por meio de conexões Ethernet de 100 Gb quando o navio retornar ao porto. No momento em que o navio atracar, os cientistas já terão informações práticas, resultados validados e a certeza de que nenhum byte de dados foi perdido no mar.

“Quando se coletam dados ambientais no mar, cada hora custa milhares de dólares.”

Os dados coletados a bordo dos navios de pesquisa da Universidade Estadual do Oregon estão entre as informações mais valiosas da comunidade científica. Cada minuto de operação representa tempo de navio, combustível, tripulação e equipamentos trabalhando em conjunto para capturar condições que podem nunca mais ocorrer. Perder sequer uma fração desses dados não é uma opção. A equipe de Sullivan projetou sua infraestrutura com base em um princípio: cada fragmento deve ser preservado, verificado e analisado antes mesmo de o navio atracar novamente.

Para atingir esse objetivo, a OSU está validando o DellPowerEdge XE7745, uma plataforma 4U refrigerada a ar, projetada para cargas de trabalho aceleradas por GPU. Este sistema combina dois processadores AMD EPYC com até oito (quatro neste caso) GPUs NVIDIA RTX Pro 6000 para servidores Baseada na arquitetura Blackwell, cada GPU oferece 96 GB de memória GDDR7 de alta velocidade e núcleos tensores avançados, projetados especificamente para inferência de IA e processamento de imagens, permitindo que pesquisadores analisem dados ambientais de alta resolução em tempo real.

O número limitado de baias de unidade do XE7745 fez com que a capacidade por slot fosse um fator determinante, levando a OSU a integrar oito unidades. SSD Solidigm D5-P5336 E3.S de 30.72 TBIsso oferece quase 250 TB de armazenamento flash em um formato compacto, combinando a eficiência da tecnologia NAND QLC da Solidigm com firmware empresarial otimizado para desempenho de gravação sustentado e integridade de dados. Para o navio de pesquisa Taani, onde espaço e refrigeração são preciosos, essa densidade permite que toda a plataforma, computação, aceleração por GPU e armazenamento redundante caibam em um único chassi 4U.

“Estamos analisando minuciosamente esses sistemas para ver até onde eles podem chegar.”

A fase de validação na Universidade Estadual do Oregon concentra-se em compreender o quão bem o Dell PowerEdge XE7745 suporta todo o fluxo de trabalho de imageamento de plâncton, do início ao fim. O objetivo não é apenas medir a velocidade, mas confirmar que o sistema consegue processar dados de forma confiável na escala e no ritmo exigidos durante as operações a bordo de navios.

Atualmente, o laboratório captura mais de 15 terabytes de imagens e dados ambientais por dia durante uma típica operação de pesquisa. Com a plataforma XE7745, a equipe processa cerca de dois terabytes de vídeo bruto por dia. Esse fluxo de trabalho utiliza 256 núcleos de CPU para segmentação e quatro GPUs NVIDIA RTX Pro 6000 Server para inferência. O resultado é um pipeline aproximadamente três vezes mais rápido que o da geração anterior.

A descoberta mais notável é que o gargalo atual é a segmentação da CPU, e não a taxa de transferência de armazenamento ou o processamento da GPU. Os SSDs Solidigm D5-P5336 em RAID 10 oferecem desempenho consistente de leitura e gravação sem ficar atrás do pipeline de processamento. As GPUs também mantêm margem de desempenho, permitindo opções de expansão conforme a disponibilidade de energia e recursos de refrigeração. Em outras palavras, o hardware não é mais o fator limitante. A arquitetura agora expõe a carga de trabalho científica real, permitindo que a equipe ajuste a etapa de segmentação com precisão.

solidigm p5336 para pesquisa oceânica de IA

SSD Solidigm P5336 de 30.72 TB

O impacto operacional é significativo. Em expedições anteriores, os pesquisadores só podiam assistir à transmissão de vídeo enquanto os dados eram coletados, sem poder confirmar se estavam amostrando água rica em plâncton ou simplesmente capturando partículas em suspensão. O plâncton segue as correntes e frequentemente se concentra em camadas sutis que não são visíveis em tempo real. Sem processamento, uma viagem de dez dias poderia gerar horas de dados com pouco valor científico útil.

Com o processamento em tempo quase real do XE7745, a equipe científica agora pode avaliar a qualidade dos dados durante a coleta. Se as imagens mostrarem plâncton escasso, o navio pode alterar a profundidade ou se mover para novas coordenadas ainda em alto mar. Essa capacidade de fazer ajustes precisos é um dos principais motivos pelos quais a computação acelerada por IA tem um papel importante em navios de pesquisa. Ela transforma a expedição de uma coleta passiva de dados em uma exploração científica ativa.

Com a adição de mais sistemas XE7745, a capacidade de processamento pode ser ampliada para lidar com todo o volume diário de dados. Essa escalabilidade é equilibrada com as limitações físicas da pesquisa a bordo de navios: consumo de energia, dissipação de calor e densidade de racks. Esses desafios não são tecnológicos, mas ambientais, e agora são visíveis justamente porque a plataforma de computação demonstrou ser capaz de acompanhar o ritmo.

“Se a sua tecnologia tem o potencial de revolucionar a ciência, vamos conversar.”

O conhecimento científico avança quando adquirimos a capacidade de ver o que antes estava oculto, e os oceanos estão repletos desses segredos. Os fluxos de trabalho de imagem da Universidade Estadual do Oregon estão revelando espécies raras de plâncton que desempenham papéis cruciais na cadeia alimentar marinha, além de demonstrar como as mudanças ambientais, como o aumento da temperatura dos oceanos, afetam sua sobrevivência. O plâncton responde rapidamente ao estresse, tornando-se um indicador precoce de mudanças mais amplas nos sistemas oceânicos e climáticos. Estudá-lo em detalhes é essencial para entendermos como o oceano sustenta a vida e como esse equilíbrio pode estar se alterando.

Esse progresso depende de ferramentas que evoluem em resposta a questões científicas. A pesquisa moderna exige a capacidade de coletar, processar e interpretar conjuntos de dados massivos nos ambientes em que são gerados. O armazenamento NVMe de alta capacidade e a aceleração por GPU permitem que o processamento seja realizado mais próximo do ponto de captura de dados, em vez de depender inteiramente de data centers centralizados. Para a OSU, isso significa análise em tempo real ou quase em tempo real na borda da rede, onde as decisões científicas podem influenciar o próprio curso da coleta de dados.

Pesquisa oceânica com IA, Savana Stallsmith, com servidor de GPU

A estudante da Universidade Estadual do Oregon, Savana Stallsmith, utiliza o Plankton AI Pipeline.

A colaboração entre a Universidade Estadual do Oregon e seus parceiros tecnológicos reflete um entendimento compartilhado dos objetivos e metas. Os limites da pesquisa não estão nas perguntas feitas, mas sim nas respostas fornecidas. Os limites são a capacidade prática de processar o volume de informações que o oceano oferece. Quando o poder computacional, o armazenamento e o fluxo de trabalho se alinham às necessidades científicas, as restrições começam a desaparecer.

Olhando para o futuro, a oportunidade reside em projetar sistemas que capturem, analisem e compreendam dados sem a necessidade de transferi-los entre múltiplas plataformas. O processamento avança na direção dos dados, e não o contrário. Clusters de computação embarcados, armazenamento NVMe de alta densidade e inferência acelerada por GPU são passos nessa direção. Isso não é "IA aspiracional". Este projeto demonstra que uma mudança significativa já está em curso na computação científica.

O oceano está mudando. Os dados são importantes. A janela de oportunidade para compreendê-lo é finita. O trabalho realizado na Universidade Estadual do Oregon demonstra o que se torna possível quando aplicamos a tecnologia certa às perguntas certas, no momento certo, nos locais onde a ciência está acontecendo.

Saiba mais sobre a pesquisa da Universidade Estadual do Oregon no SC25:

Dell Technologies Talk
Data: terça-feira, 18/11
Horário: 11: 30 am
Localização: Área de palestras do estande principal da Dell

Supermicro Talk
Data: Quarta-feira, 19/11
Hora: 5: 00 pm
Localização: Estande principal da Supermicro nº 3504

Envolva-se com a StorageReview

Newsletter | YouTube | Podcast iTunes/Spotify | Instagram: | Twitter | TikTok | RSS feed

Brian Beeler

Brian está localizado em Cincinnati, Ohio e é analista-chefe e presidente da StorageReview.com.