홈페이지 EnterpriseAI WEKA, NVIDIA 통합 및 증강 메모리 그리드 공개

WEKA, NVIDIA 통합 및 증강 메모리 그리드 공개

by 해롤드 프리츠

AI 추론을 위한 WEKA의 증강 메모리는 GPU 효율성을 높이고, 대기 시간과 비용을 줄이는 동시에 엔터프라이즈 워크로드에 맞게 AI 모델을 확장합니다.

WEKA는 NVIDIA AI Data Platform 참조 설계와의 전략적 통합을 발표했습니다. 이는 에이전트 AI 및 복잡한 추론 모델에 맞게 명확하게 조정된 최적화된 인프라를 제공하기 위해 중요한 NVIDIA 스토리지 인증을 획득했습니다. 이 발표와 함께 WEKA는 혁신적인 Augmented Memory Grid 기능과 NVIDIA GB200 NVL72 및 엔터프라이즈 규모 AI 공장 배포를 위한 NVIDIA 인증 시스템 스토리지를 포함한 추가 NVIDIA Cloud Partner(NCP) 참조 아키텍처 인증을 도입했습니다.

AI 에이전트 가속화

NVIDIA AI Data Platform은 NVIDIA Blackwell 아키텍처, NVIDIA BlueField DPU, Spectrum-X 네트워킹 및 NVIDIA AI Enterprise 소프트웨어를 완벽하게 통합하여 엔터프라이즈 AI 인프라에서 상당한 도약을 나타냅니다. 이 고급 NVIDIA 인프라를 WEKA Data Platform과 페어링하면 엔터프라이즈는 고성능 AI 추론 워크로드를 위해 명확하게 설계된 대규모 확장 가능한 스토리지 기반을 배포할 수 있습니다.

이 통합 솔루션은 기업 AI의 증가하는 수요를 직접 해결하여 AI 쿼리 에이전트에게 중요한 비즈니스 인텔리전스에 대한 원활하고 가속화된 액세스를 제공하여 추론 성능과 추론 정확도를 크게 향상시킵니다. WEKA의 데이터 플랫폼은 AI 시스템이 데이터를 실행 가능한 인텔리전스로 빠르게 변환할 수 있도록 보장하여 차세대 AI 모델에 필요한 정교한 추론을 지원합니다.

WEKA 증강 메모리 그리드

에이전트 AI 모델은 지속적으로 진화하며 더 큰 컨텍스트 창, 방대한 매개변수 수, 더 중요한 메모리 요구 사항을 관리할 수 있습니다. 이러한 발전은 종종 기존 GPU 메모리 용량의 한계를 넘어서 AI 추론에 병목 현상을 일으킵니다. WEKA는 획기적인 Augmented Memory Grid 솔루션으로 이러한 과제를 해결합니다. 이 솔루션은 AI 워크로드에 사용 가능한 메모리를 확장하여 현재 단일 테라바이트 제한을 훨씬 뛰어넘는 페타바이트 규모의 증분을 제공하는 혁신입니다.

AI 추론을 위한 증강 메모리 - 증강 메모리 그리드

WEKA의 Augmented Memory Grid는 WEKA의 데이터 플랫폼 소프트웨어와 NVIDIA의 가속 컴퓨팅 및 네트워킹 기술을 결합하여 AI 추론을 크게 향상시킵니다. 이 조합은 마이크로초 지연 시간으로 거의 메모리 속도에 접근하여 토큰 처리 성능과 전반적인 AI 추론 효율성을 획기적으로 개선합니다.

WEKA 증강 메모리 그리드의 주요 장점은 다음과 같습니다.

  • 극적으로 단축된 대기 시간: 105,000개 토큰을 대상으로 한 테스트에서 WEKA의 증강 메모리 그리드는 기존 재계산 방법에 비해 첫 번째 토큰까지의 시간을 41배나 단축하는 놀라운 성과를 보였습니다.

  • 최적화된 토큰 처리량: WEKA 솔루션은 클러스터 전반에서 추론 워크로드를 효율적으로 처리하여 전체 비용을 낮추고 토큰 처리량을 높여 시스템 전체에서 처리되는 토큰당 비용을 최대 24%까지 낮춥니다.

이러한 성능 향상은 직접적으로 향상된 경제적 효율성으로 이어지며, 기업은 모델 기능이나 인프라 성능을 저하시키지 않고도 AI 기반 혁신을 가속화할 수 있습니다.

WEKApod 니트로

WEKApod Nitro Data Platform 어플라이언스는 여러 NVIDIA 인증을 획득하여 WEKA를 엔터프라이즈 AI를 위한 선도적인 고성능 스토리지 공급업체로 자리매김했습니다.

  • NVIDIA 클라우드 파트너(NCP) 인증: WEKApod Nitro는 HGX H200, B200, GB200 NVL72를 포함하여 NVIDIA의 NCP 참조 아키텍처에 대해 인증된 최초의 스토리지 솔루션 중 하나입니다. 이러한 어플라이언스는 1,152U 구성에서 최대 8개의 GPU까지 대규모 GPU 클러스터를 지원하여 서비스 공급자와 개발자에게 힘을 실어주며, 뛰어난 성능 밀도와 전력 효율성을 유지합니다.

  • NVIDIA 인증 시스템 스토리지 지정: WEKApod Nitro 어플라이언스는 NVIDIA의 새로운 엔터프라이즈 스토리지 인증을 받았으며, NVIDIA Enterprise Reference Architectures 및 모범 사례와의 호환성을 보장합니다. 이 지정은 WEKA의 데이터 플랫폼이 까다로운 엔터프라이즈 AI 및 HPC 배포에 최적의 스토리지 성능, 효율성 및 확장성을 제공한다는 것을 검증합니다.

WEKA의 최고 제품 책임자인 나일레시 파텔은 NVIDIA와의 이 파트너십이 가진 혁신적 잠재력을 강조했습니다. 이 개발을 항공우주 분야의 혁신과 비교하면서, 파텔은 "마치 음속 장벽을 깨는 것이 새로운 지평을 연 것처럼, WEKA의 증강 메모리 그리드는 AI 메모리 장벽을 깨고 GPU 메모리를 극적으로 확장하고 토큰 효율성을 최적화합니다. 이 혁신은 AI 토큰 경제를 근본적으로 변화시켜 성능을 희생하지 않고도 더 빠른 혁신과 더 낮은 비용을 가능하게 합니다."라고 말했습니다.

NVIDIA의 스토리지 네트워킹 기술 부사장인 롭 데이비스는 이 통합의 중요성을 더욱 강조했습니다. "에이전트 AI와 추론 모델을 배포하는 기업은 전례 없는 효율성과 확장성이 필요합니다. NVIDIA와 WEKA 기술을 결합하면 AI 에이전트가 추론 중에 타의 추종을 불허하는 속도와 정확도로 데이터에 액세스하고 처리할 수 있습니다."

유효성

  • NVIDIA Blackwell 시스템용 WEKA의 NCP 참조 아키텍처는 3월에 출시될 예정입니다.
  • WEKA 증강 메모리 그리드 기능은 2025년 봄에 WEKA 데이터 플랫폼 고객을 대상으로 일반적으로 출시될 예정입니다.

StorageReview에 참여

뉴스레터 | 유튜브 | 팟캐스트 iTunes/스포티 파이 | 인스타그램 | 트위터 | 틱톡 서비스 | RSS 피드