MinIO는 대규모 AI 추론 환경에서 증가하는 병목 현상을 해결하기 위해 설계된 컨텍스트 메모리 저장소인 MemKV를 발표했습니다. AIStor와 함께 MinIO 포트폴리오의 두 번째 핵심 구성 요소로 자리매김한 MemKV는 MinIO의 데이터 인프라를 메모리 계층으로 확장하여 GPU 클러스터 전반에서 작동하는 에이전트형 AI 워크로드에 영구적이고 공유 가능한 컨텍스트를 제공합니다. AI 시스템이
MinIO는 대규모 AI 추론 환경에서 증가하는 병목 현상을 해결하기 위해 설계된 컨텍스트 메모리 저장소인 MemKV를 발표했습니다. AIStor와 함께 MinIO 포트폴리오의 두 번째 핵심 구성 요소로 자리매김한 MemKV는 MinIO의 데이터 인프라를 메모리 계층으로 확장하여 GPU 클러스터 전반에서 작동하는 에이전트형 AI 워크로드에 영구적이고 공유 가능한 컨텍스트를 제공합니다. AI 시스템이
스칼리티는 다양한 AI 워크로드 지원, 사이버 복원력 강화, 데이터에 대한 주권적 통제 유지라는 요구에 직면한 기업을 위한 플랫폼인 스칼리티 자율 데이터 인프라(ADI)를 발표했습니다. 이 제품은 스칼리티의 분산 객체 스토리지 기반과 운영 복잡성을 줄이면서도 사람의 감독을 유지하도록 설계된 새로운 자율 운영 계층을 결합합니다.
랙스페이스 테크놀로지와 AMD는 규제 대상 기업 및 국가 차원의 워크로드를 위한 엔터프라이즈 AI 인프라에 초점을 맞춘 다년간의 전략적 파트너십 프레임워크를 구축하는 양해각서를 체결했습니다. 이 협약은 보안, 거버넌스, 규정 준수 및 운영 책임이 핵심 요구 사항인 미션 크리티컬 AI 배포를 위해 설계된 엔터프라이즈 AI 클라우드를 중심으로 합니다.
NVIDIA DGX Spark에 대한 이야기가 나올 때면 항상 두 가지가 먼저 언급됩니다. 첫 번째는 핵심 사양입니다. 약 4,000달러짜리 데스크톱 PC에 128GB의 통합 메모리가 탑재되어 있다는 점인데, 불과 2년 전만 해도 엔지니어의 책상 위에 놓이는 것조차 상상하기 어려웠을 수치입니다. 두 번째는 200입니다.
NVIDIA와 IREN Limited는 차세대 AI 인프라 구축을 가속화하기 위한 전략적 파트너십을 발표했습니다. 이번 파트너십을 통해 IREN은 전 세계 데이터 센터 네트워크를 활용하여 최대 5기가와트(GW) 규모의 NVIDIA DSX 기반 AI 인프라를 단계적으로 구축할 계획입니다. NVIDIA의 AI 시스템 및 아키텍처와 IREN의 전력, 토지, 데이터 인프라 구축 경험이 결합됩니다.
앤스로픽(Anthropic)은 스페이스X(SpaceX)와의 새로운 컴퓨팅 계약을 통해 스페이스X의 콜로서스 1 데이터센터의 모든 컴퓨팅 용량을 이용할 수 있게 되었으며, 이를 통해 한 달 안에 300메가와트 이상의 용량과 220,000만 개 이상의 NVIDIA GPU를 추가 확보하게 되었습니다. 이번 계약은 클로드(Claude) 사용자들에게 즉각적인 용량 증가라는 이점을 제공할 뿐만 아니라, 앤스로픽의 컴퓨팅 역량 강화에도 크게 기여할 것으로 기대됩니다.
AMD는 데이터 센터를 재구축하지 않고 온프레미스 AI 추론을 원하는 기업을 위한 PCIe 가속기인 Instinct MI350P를 발표했습니다. 이 카드는 표준 공랭식 서버에 맞게 설계된 듀얼 슬롯, 풀 사이즈, 풀 길이 디자인입니다. 또한 AMD가 현세대 Instinct 칩을 PCIe 가속기에 탑재한 것은 거의 4년 만에 처음입니다.
IBM은 Think 2026에서 기업들이 데이터, 인프라, 거버넌스 및 규제 환경 전반에 걸쳐 AI를 운영하는 방법을 보여주는 다양한 발표를 했습니다. 이번 발표에는 새로운 기업 AI 운영 모델, IBM Sovereign Core의 정식 출시, 그리고 클리블랜드 클리닉 및 RIKEN과 함께 달성한 양자 컴퓨팅 분야의 중요한 성과 등이 포함되었습니다.
IBM과 매사추세츠 공과대학(MIT)은 인공지능, 알고리즘, 양자 컴퓨팅 분야의 기초 연구를 발전시키고, 기존 시스템의 실질적인 한계를 뛰어넘는 컴퓨팅 방식에 중점을 두는 새로운 공동 연구 기관인 MIT-IBM 컴퓨팅 연구소를 설립했습니다. 이 연구소는 MIT-IBM 왓슨 프로젝트에서 발전한 것입니다.
구글은 Google Cloud Next에서 차세대 AI 가속기인 TPU 8t "Sunfish" (학습용)와 TPU 8i "Zebrafish" (추론용) 및 새로운 Virgo 데이터 센터 패브릭을 발표했습니다. 구글 블로그 게시물을 보면 이 칩들은 수십만 개의 칩 규모로 최첨단 혼합형 전문가 모델을 학습시키는 "에이전트 시대"에 최적화되어 있음을 알 수 있습니다.