인텔은 ISC 23 프레젠테이션에서 고성능 컴퓨팅(HPC) 및 인공 지능(AI) 워크로드에 대한 성능 리더십을 강조하고 향후 HPC 및 AI 제품 포트폴리오를 공유했으며 Aurora를 사용하기 위한 국제적 노력에 대한 야심 찬 계획을 발표했습니다. 과학과 사회를 위한 생성 AI 모델을 개발하기 위한 슈퍼컴퓨터.
인텔은 ISC 23 프레젠테이션에서 고성능 컴퓨팅(HPC) 및 인공 지능(AI) 워크로드에 대한 성능 리더십을 강조하고 향후 HPC 및 AI 제품 포트폴리오를 공유했으며 Aurora를 사용하기 위한 국제적 노력에 대한 야심 찬 계획을 발표했습니다. 과학과 사회를 위한 생성 AI 모델을 개발하기 위한 슈퍼컴퓨터.
경쟁 성능은 Intel의 결과가 경쟁에 대한 확실한 승자였을 때 가장 뛰어났습니다. Intel의 Data Center GPU Max 시리즈는 다양한 워크로드에서 NVIDIA H100 PCIe 카드를 평균 30% 능가했습니다. 소프트웨어 공급업체 Ansys의 독립적인 결과에 따르면 AI 가속 HPC 애플리케이션에서 H50보다 Max 시리즈 GPU의 속도가 100% 향상되었습니다.
Xeon Max 시리즈 CPU는 HPCG(High-Performance Conjugate Gradients) 벤치마크에서 AMD의 Genoa 프로세서에 비해 65% 향상된 성능을 보여주었고 전력 소모도 적었습니다. HPC에서 가장 선호하는 4세대 Intel Xeon Scalable 프로세서는 AMD의 Milan50에 비해 평균 4%의 속도 향상을 제공했습니다. BP의 최신 4세대 Xeon HPC 클러스터는 향상된 에너지 효율성으로 이전 세대 프로세서보다 8배 향상된 성능을 보여주었습니다. Gaudi2 딥 러닝 가속기는 NVIDIA의 A2.4보다 최대 100배 더 빠른 성능으로 딥 러닝, 교육 및 추론에서 경쟁적으로 수행했습니다.
차세대 CPU 및 AI 최적화 GPU
Intel의 Jeff McVeigh(Intel 기업 부사장 겸 Super Compute Group 총괄 책임자)는 높은 메모리 대역폭 수요를 충족하도록 설계된 Intel의 차세대 CPU를 소개했습니다. 인텔은 Granite Rapids를 위해 새로운 유형의 DIMM–MCR(Multiplexer Combined Ranks)을 개발했습니다. MCR은 DDR8,800 기반의 초당 5메가 전송 속도와 1.5소켓 시스템에서 XNUMXTB/s 이상의 메모리 대역폭 기능을 달성합니다.
인텔은 또한 딥 러닝 교육을 가속화하도록 설계된 Supermicro의 새로운 AI 최적화 x8 Max 시리즈 GPU 기반 서브 시스템을 공개했습니다. OEM은 이번 여름에 Max Series GPU x4 및 x8 OAM 하위 시스템과 PCIe 카드가 포함된 솔루션을 제공할 것으로 예상됩니다.
인텔의 차세대 Max 시리즈 GPU인 Falcon Shores는 고객에게 미래의 새롭고 끊임없이 변화하는 워크로드를 위해 시스템 수준 CPU 및 개별 GPU 조합을 구현할 수 있는 유연성을 제공할 것입니다. Falcon Shores 시스템은 모듈식 타일 기반 아키텍처를 활용하여 다음을 수행할 수 있습니다.
- FP64에서 BF16, FP8까지 HPC 및 AI 데이터 유형을 지원합니다.
- 최대 288TB/s의 총 대역폭과 대폭 향상된 고속 I/O로 최대 3GB의 HBM9.8 메모리를 사용할 수 있습니다.
- CXL 프로그래밍 모델을 강화하십시오.
- oneAPI를 통해 통합 GPU 프로그래밍 인터페이스를 제공합니다.
과학을 위한 생성 AI
Argonne National Laboratory는 인텔 및 HPE와 협력하여 과학 연구 커뮤니티를 위한 일련의 생성 AI 모델을 만들 계획을 발표했습니다. 과학을 위한 이러한 생성 AI 모델은 일반 텍스트, 코드, 과학 텍스트 및 생물학, 화학, 재료 과학, 물리학, 의학 및 기타 소스의 구조화된 과학 데이터에 대해 훈련됩니다.
생성된 모델(최대 1조 개의 매개변수 포함)은 분자 및 재료 설계에서 수백만 소스에 걸친 지식 합성에 이르기까지 다양한 과학적 응용 프로그램에 사용되어 시스템 생물학, 고분자 화학 분야에서 새롭고 흥미로운 실험을 제안합니다. 에너지 재료, 기후 과학 및 우주론. 이 모델은 또한 암 및 기타 질병과 관련된 생물학적 과정의 식별을 가속화하고 약물 설계의 대상을 제안하는 데 사용될 것입니다.
프로젝트를 발전시키기 위해 Argonne은 다음을 포함하는 국제 협력을 주도하고 있습니다.
- 인텔
- HPE
- 에너지 연구실
- 미국 및 국제 대학
- 비영리 단체
- 국제 파트너
Aurora는 올해 출시되면 XNUMX엑사플롭 이상의 최대 배정밀도 컴퓨팅 성능을 제공할 것으로 예상됩니다.
oneAPI는 HPC 애플리케이션에 이점을 제공합니다.
최신 Intel oneAPI 도구는 OpenMP GPU 오프로드를 통해 HPC 애플리케이션의 속도를 높이고 OpenMP 및 Fortran에 대한 지원을 확장하며 TensorFlow 및 PyTorch를 포함한 최적화된 프레임워크와 AI 도구를 통해 AI 및 딥 러닝을 가속화하여 성능을 향상시킵니다.
멀티아키텍처 프로그래밍은 프로그래머가 oneAPI의 SYCL 구현, Codeplay에서 개발한 NVIDIA 및 AMD 프로세서용 oneAPI 플러그인, 코드를 CUDA에서 SYCL 및 C++로 마이그레이션하는 Intel DPC++ 호환성 도구(일반적으로 코드의 90-95%가 자동으로 마이그레이션됨)를 통해 더 쉬워집니다. . 결과 SYCL 코드는 NVIDIA 및 AMD 기본 시스템 언어에서 실행되는 동일한 코드와 비슷한 성능을 보여줍니다. 데이터에 따르면 Max Series GPU에서 실행되는 DPEcho 천체물리학 애플리케이션용 SYCL 코드가 NVIDIA H100에서 동일한 CUDA 코드보다 48% 더 우수한 것으로 나타났습니다.
StorageReview에 참여
뉴스레터 | 유튜브 | 팟캐스트 iTunes/스포티 파이 | 인스타그램 | 트위터 | 틱톡 서비스 | RSS 피드