StorageReview.com
AI  ◇  기업

MinIO, 페타바이트급 AI 추론 메모리용 MemKV 출시

MinIO는 대규모 AI 추론 환경에서 증가하는 병목 현상을 해결하기 위해 설계된 컨텍스트 메모리 저장소인 MemKV를 발표했습니다. AIStor와 함께 MinIO 포트폴리오의 두 번째 핵심 구성 요소로 자리매김한 MemKV는 MinIO의 데이터 인프라를 메모리 계층으로 확장하여 GPU 클러스터 전반에서 작동하는 에이전트형 AI 워크로드에 영구적이고 공유 가능한 컨텍스트를 제공합니다. AI 시스템이

AI  ◇  기업

Scality, AI 기반 주권 데이터 인프라를 위한 ADI 플랫폼 출시

스칼리티는 다양한 AI 워크로드 지원, 사이버 복원력 강화, 데이터에 대한 주권적 통제 유지라는 요구에 직면한 기업을 위한 플랫폼인 스칼리티 자율 데이터 인프라(ADI)를 발표했습니다. 이 제품은 스칼리티의 분산 객체 스토리지 기반과 운영 복잡성을 줄이면서도 사람의 감독을 유지하도록 설계된 새로운 자율 운영 계층을 결합합니다.

AI  ◇  클라우드  ◇  기업

랙스페이스와 AMD는 기업 워크로드를 위한 관리형 AI 클라우드 구축을 계획하고 있습니다.

랙스페이스 테크놀로지와 AMD는 규제 대상 기업 및 국가 차원의 워크로드를 위한 엔터프라이즈 AI 인프라에 초점을 맞춘 다년간의 전략적 파트너십 프레임워크를 구축하는 양해각서를 체결했습니다. 이 협약은 보안, 거버넌스, 규정 준수 및 운영 책임이 핵심 요구 사항인 미션 크리티컬 AI 배포를 위해 설계된 엔터프라이즈 AI 클라우드를 중심으로 합니다.

AI  ◇  기업

NVIDIA DGX Spark 클러스터 리뷰: Dell, GIGABYTE 및 HP에서의 분산 추론

NVIDIA DGX Spark에 대한 이야기가 나올 때면 항상 두 가지가 먼저 언급됩니다. 첫 번째는 핵심 사양입니다. 약 4,000달러짜리 데스크톱 PC에 128GB의 통합 메모리가 탑재되어 있다는 점인데, 불과 2년 전만 해도 엔지니어의 책상 위에 놓이는 것조차 상상하기 어려웠을 수치입니다. 두 번째는 200입니다.

NVIDIA 빌딩
AI  ◇  기업

NVIDIA와 IREN, 대규모 AI 인프라 구축 가속화를 위한 파트너십 체결

NVIDIA와 IREN Limited는 차세대 AI 인프라 구축을 가속화하기 위한 전략적 파트너십을 발표했습니다. 이번 파트너십을 통해 IREN은 전 세계 데이터 센터 네트워크를 활용하여 최대 5기가와트(GW) 규모의 NVIDIA DSX 기반 AI 인프라를 단계적으로 구축할 계획입니다. NVIDIA의 AI 시스템 및 아키텍처와 IREN의 전력, 토지, 데이터 인프라 구축 경험이 결합됩니다.

AI  ◇  기업

Anthropic Signs는 SpaceX Colossus 1 계약을 통해 주요 컴퓨팅 확장을 확보했습니다.

앤스로픽(Anthropic)은 스페이스X(SpaceX)와의 새로운 컴퓨팅 계약을 통해 스페이스X의 콜로서스 1 데이터센터의 모든 컴퓨팅 용량을 이용할 수 있게 되었으며, 이를 통해 한 달 안에 300메가와트 이상의 용량과 220,000만 개 이상의 NVIDIA GPU를 추가 확보하게 되었습니다. 이번 계약은 클로드(Claude) 사용자들에게 즉각적인 용량 증가라는 이점을 제공할 뿐만 아니라, 앤스로픽의 컴퓨팅 역량 강화에도 크게 기여할 것으로 기대됩니다.

AI  ◇  기업

AMD Instinct MI350P: 엔터프라이즈급 PCIe AI 추론 기능이 일반 서버로 돌아왔습니다.

AMD는 데이터 센터를 재구축하지 않고 온프레미스 AI 추론을 원하는 기업을 위한 PCIe 가속기인 Instinct MI350P를 발표했습니다. 이 카드는 표준 공랭식 서버에 맞게 설계된 듀얼 슬롯, 풀 사이즈, 풀 길이 디자인입니다. 또한 AMD가 현세대 Instinct 칩을 PCIe 가속기에 탑재한 것은 거의 4년 만에 처음입니다.

IBM 양자 컴퓨터
AI  ◇  클라우드  ◇  기업

IBM은 Think 2026에서 AI 운영, 국가 주도 인프라 및 양자 신약 개발 진전을 결합한 발표를 진행합니다.

IBM은 Think 2026에서 기업들이 데이터, 인프라, 거버넌스 및 규제 환경 전반에 걸쳐 AI를 운영하는 방법을 보여주는 다양한 발표를 했습니다. 이번 발표에는 새로운 기업 AI 운영 모델, IBM Sovereign Core의 정식 출시, 그리고 클리블랜드 클리닉 및 RIKEN과 함께 달성한 양자 컴퓨팅 분야의 중요한 성과 등이 포함되었습니다.

AI  ◇  기업

MIT-IBM 컴퓨팅 연구소, 양자 컴퓨팅, 인공지능 및 알고리즘 분야로 연구 범위 확장

IBM과 매사추세츠 공과대학(MIT)은 인공지능, 알고리즘, 양자 컴퓨팅 분야의 기초 연구를 발전시키고, 기존 시스템의 실질적인 한계를 뛰어넘는 컴퓨팅 방식에 중점을 두는 새로운 공동 연구 기관인 MIT-IBM 컴퓨팅 연구소를 설립했습니다. 이 연구소는 MIT-IBM 왓슨 프로젝트에서 발전한 것입니다.

AI  ◇  기업

구글, TPU 8t Sunfish 및 TPU 8i Zebrafish 발표

구글은 Google Cloud Next에서 차세대 AI 가속기인 TPU 8t "Sunfish" (학습용)와 TPU 8i "Zebrafish" (추론용) 및 새로운 Virgo 데이터 센터 패브릭을 발표했습니다. 구글 블로그 게시물을 보면 이 칩들은 수십만 개의 칩 규모로 최첨단 혼합형 전문가 모델을 학습시키는 "에이전트 시대"에 최적화되어 있음을 알 수 있습니다.