홈페이지 EnterpriseAI AMD Zen 5 아키텍처 및 XDNA 2 발표

AMD Zen 5 아키텍처 및 XDNA 2 발표

by 조던 라누스

AMD Zen 5 아키텍처는 혁신적인 모듈식 설계를 채택하여 AMD가 데스크탑, 서버, 클라이언트 및 임베디드용 CPU를 만들 수 있도록 합니다.

AMD의 2024 Tech Day에서는 최신 발전의 세부 사항을 공개하고 특히 최신 Zen 5 CPU 및 XDNA AI 중심 아키텍처를 중심으로 많은 내용을 다루었습니다. 이 행사는 AI 효율성, 전력 성능 및 여러 애플리케이션 전반에 걸친 원활한 통합을 혁신하려는 AMD의 비전을 강조하여 고성능 컴퓨팅 부문에서의 리더십을 재확인했습니다.

Microsoft와의 전략적 협력은 광범위한 애플리케이션 전반에 걸쳐 전례 없는 효율성, 성능 및 통합을 제공함으로써 AI PC 경험에서 AMD의 리더십을 위한 기반을 마련했습니다. 최대 5개의 코어와 192개의 스레드를 갖춘 384세대 EPYC CPU는 전력 효율성과 AI 가속화 측면에서 상당한 이점을 약속합니다. AMD는 고급 분기 예측, 듀얼 디코드 파이프 및 새로운 Math Acceleration Unit을 통해 Zen 5가 이전 제품에 비해 단일 코어 AES-XTS 성능을 35% 향상시키고 기계 학습 작업을 32% 향상시켰다고 밝혔습니다. AMD가 계속해서 처리 능력과 효율성의 경계를 확장함에 따라 Zen 5 아키텍처는 데이터 센터 및 서버 시장에 혁명을 일으킬 준비가 되어 있습니다.

AMD Zen 5 이벤트 라이브

AMD Zen 5 아키텍처는 혁신적인 모듈식 설계를 채택하여 AMD가 데스크탑, 서버, 클라이언트 및 임베디드 애플리케이션에 맞는 제품을 만들 수 있도록 합니다. 4nm 및 3nm 공정 기술을 통합하면 Zen5 기반 제품이 다양한 사용 사례에서 최적화된 성능과 전력 효율성을 제공할 수 있습니다.

AMD Zen 5

2024 Tech Day의 AMD 프레젠테이션에서 Mark Papermaster는 Zen 5 아키텍처의 중요한 발전을 공개했으며 특히 5세대 EPYC CPU를 강조했습니다. 2024년 하반기에 출시될 EPYC 라인은 비교할 수 없는 성능과 효율성을 제공하여 서버 및 데이터 센터 시장에서 밀도와 성능 지표를 극한으로 끌어올릴 것을 약속합니다.

5세대 EPYC CPU는 코어 수와 스레딩 기능을 크게 늘렸습니다. 이러한 개선 사항에는 TSMC와의 지속적인 파트너십 및 최적화된 금속 스택을 통해 가능해진 전력 효율성 개선도 포함됩니다. 후자는 열적, 전기적 성능을 눈에 띄게 향상시켰습니다. 이 아키텍처는 Zen 35에 비해 단일 코어 AES-XTS 성능이 최대 32% 향상되고 단일 코어 기계 학습 작업이 최대 4% 향상될 것을 약속하는 새로운 Math Acceleration Unit을 도입하여 고급 AI 가속을 활용합니다.

Zen 5의 아키텍처 발전은 포괄적입니다. 명령 가져오기 및 디코드 단계는 고급 분기 예측 및 듀얼 디코드 파이프를 통해 향상되어 대기 시간을 줄이고 정확성을 향상시켰습니다. 정수 실행 유닛은 더 큰 실행 창 내에서 8개 범위의 디스패치/폐기 기능과 더욱 통합된 ALU 스케줄러를 통해 상당한 업그레이드를 확인했습니다. 로드/저장 기능 향상에는 L48 캐시와 부동 소수점 장치 모두에 대한 최대 대역폭이 두 배인 12KB 1방향 L1 데이터 캐시가 포함되어 있으며 이는 데이터 집약적인 작업에 매우 중요합니다.

Zen 5 아키텍처에는 데이터 대역폭도 크게 향상되었습니다. 48KB 12방향 L1 데이터 캐시를 갖춘 향상된 로드/저장 기능은 데이터 집약적인 작업에 필수적인 L1 캐시 및 부동 소수점 장치에 대한 최대 대역폭을 두 배로 늘렸습니다. AVX-512 및 전체 512비트 데이터 경로를 통해 비행 중에 더 많은 수의 부동 소수점 명령을 처리할 수 있는 아키텍처 기능은 AI 및 벡터 워크로드에서 상당한 성능 향상을 보장합니다.

부동 소수점 및 벡터 수학 단위 실행도 크게 개선되었습니다. 전체 512비트 데이터 경로와 512개의 파이프라인(부동 소수점 추가 작업을 위한 4사이클 대기 시간 제공)을 갖춘 AVX-256는 동시 부동 소수점 명령을 관리하는 기능을 크게 향상시킵니다. 이는 특히 벡터 및 AI 워크로드에 이점을 제공하여 기계 학습 및 데이터 집약적 작업의 성능을 크게 향상시킵니다. 이는 AMD가 512비트 성능을 달성하기 위해 XNUMX비트 경로를 "이중 펌핑"한 Zen XNUMX와 대조됩니다.

AMD Zen 5 Turin 하이라이트

Zen 5는 이전 제품인 Zen 16에 비해 데스크톱 및 모바일 프로세서에 대해 평균 4%의 IPC 향상을 제공합니다. 이는 더 넓은 디스패치 및 실행 단위, 증가된 데이터 대역폭, 향상된 프리페칭 알고리즘을 포함한 아키텍처 개선을 통해 달성됩니다. IPC의 이점은 게임에서 콘텐츠 제작, 기계 학습에 이르기까지 다양한 애플리케이션 전반에 걸쳐 실제 성능 향상으로 이어집니다.

GPU 전면에서 AMD는 전력 성능 효율성을 위해 RDNA 3 아키텍처를 계속 최적화하고 있습니다. AMD는 이전 Ryzen CPU보다 와트당 성능이 최대 32% 더 높다고 주장합니다. 이는 더 나은 메모리 관리, 두 배 속도의 일반 게임 텍스처 작업 및 향상된 전원 관리 기능을 통해 달성됩니다.

AMD의 Zen 5 아키텍처는 Zen 아키텍처, 특히 EPYC 라인의 인상적인 발전으로, 데스크탑과 모바일에서 서버 및 데이터 센터 시장에 이르기까지 전반적으로 성능 표준을 향상시킬 것을 약속합니다. 일부 칩의 코어 수, 스레딩, 전력 효율성 및 AI 가속이 크게 개선된 5세대 EPYC CPU는 현대 데이터 중심 워크로드의 증가하는 요구를 충족할 수 있는 위치에 있습니다.

XDNA

인공 지능 그룹의 수석 부사장인 Vamsi Boppana는 AMD의 새로운 AI 중심 아키텍처의 혁신적인 잠재력을 설명했습니다. AI 워크로드의 기하급수적인 성장과 전문화는 혁신적인 컴퓨팅 아키텍처를 요구하며, AMD의 대응은 XDNA 2 아키텍처의 도입입니다.

이러한 혁신의 중심에는 다양한 AI 및 DSP 애플리케이션, 광범위한 통신, 5G 배포, 국방 레이더 신호 처리, 3D 관점을 위한 방송 실시간 AI 처리 및 의료 이미지 처리 분야의 유산으로 알려진 AMD XDNA 아키텍처가 있습니다. 아키텍처는 기존의 고정 컴퓨팅 및 캐시 기반 메모리 계층 구조에서 보다 유연하고 적응 가능한 모델로 이동합니다. 이러한 공간 재구성성과 타일형 데이터 흐름 아키텍처를 통해 효율적인 멀티태스킹과 실시간 성능 보장이 가능합니다.

프레젠테이션에서는 AI 워크로드에 높은 효율성과 성능을 제공하도록 설계된 NPU가 통합된 AMD의 x86 프로세서를 강조했습니다. 3세대 AMD Ryzen AI 프로세서는 최대 50TOPS(초당 수조 개의 연산)를 달성하고 최대 12개의 CPU 코어와 16개의 GPU 컴퓨팅 유닛을 통합하는 등 NPU 기능에서 상당한 발전을 자랑합니다. 이러한 프로세서는 Adobe, Black Magic 및 Topaz Labs와 같은 플랫폼 전반에 걸쳐 100개 이상의 AI 기반 경험을 지원하도록 설정되어 차세대 AI PC 경험의 중심이 됩니다.

XDNA 2 아키텍처 내의 AI 엔진에는 INT8 및 블록 FP16과 같은 다양한 데이터 유형에 대한 향상된 지원이 포함되어 있어 다양한 AI 애플리케이션에서 높은 성능과 정확성을 보장합니다. 적응형 AI 아키텍처는 AMD 제품 포트폴리오 전반에 걸쳐 확장 가능한 통합을 가능하게 하며, 공간 재구성성과 타일형 데이터 흐름 아키텍처를 통해 효율적인 멀티태스킹과 보장된 실시간 성능을 제공합니다.

특히 블록 FP16을 사용하면 정확도 손실이 거의 또는 전혀 없이 FP32 모델을 즉시 교체할 수 있으므로 이미지 생성, 언어 모델, 실시간 오디오 및 비디오 처리와 같은 작업에 매우 효율적입니다.

AMD Zen 5 및 XDNA 아키텍처

한 가지 뛰어난 기능은 런타임에 XDNA 패브릭을 구성하는 기능입니다. 이를 통해 데이터 경로의 유연성과 NPU 분할을 통해 다양한 크기의 여러 모델을 동시에 실행할 수 있습니다. 또한 생산성 향상과 몰입형 협업을 위해 Copilot+와 같은 AI 기반 경험을 제공할 수 있는 유연성을 제공합니다. AMD의 CPU, GPU 및 NPU 구성 요소 전반에 걸쳐 통합 AI 소프트웨어 스택을 통합하면 광범위한 모델 지원과 최적화된 성능이 가능해 개발자가 수천 개의 AI 모델을 빠르고 효과적으로 배포할 수 있습니다.

AMD XDNA 2 아키텍처는 AI 기술의 획기적인 도약을 보여줍니다. 최대 XNUMX개의 동시 공간 스트림을 통해 이전 세대에 비해 전력 효율성이 두 배로 향상됩니다. 이는 AMD의 솔루션을 강력하고 효율적으로 만들어 PC와 그 이상에서 AI 애플리케이션의 새로운 시대를 여는 길을 열어줍니다.

3세대 AMD Ryzen AI 프로세서는 또한 새로운 Trusted IO 기능을 도입하여 보안을 강화했습니다. 이러한 보안 강화는 민감한 데이터를 보호하고 AI 기반 애플리케이션에서 안정적인 성능을 보장하는 데 중요하며, 안전하고 효율적인 AI 솔루션에 대한 AMD의 노력을 강화합니다.

AMD Zen 5 및 XDNA 2 사양

Zen 5 아키텍처
특색 세부 정보
공정 기술 4nm 및 3nm
코어 카운트 최대 192 코어
스레드 수 최대 384개의 스레드
캐시 48KB 12방향 L1 데이터 캐시
대역폭 L1 캐시 및 부동 소수점 장치로 최대 대역폭을 두 배로 늘립니다.
정수 실행 8와이드 파견/폐기, 6 ALU, 3 곱셈
부동 소수점 실행 전체 512비트 데이터 경로, 512개 파이프라인을 갖춘 AVX-6
AI 가속 새로운 수학 가속 장치
IPC 향상 Zen 16에 비해 평균 IPC 4% 향상
성능 향상 단일 코어 AES-XTS 35% 향상, 기계 학습 작업 32% 향상
전력 효율 향상된 금속 스택으로 와트당 성능에 최적화됨
제품 신청 데스크탑, 모바일, 서버 및 데이터 센터
XDNA 2 아키텍처
AI 엔진 타일 최대 32까지
AI 성능 최대 50개 TOPS
코어 카운트 최대 12 개의 CPU 코어
GPU 계산 단위 최대 16까지
지원되는 데이터 유형 INT8, 블록 FP16
효율성: 이전 세대 대비 2배의 전력 효율성
동시 스트림 최대 8까지
보안 새로운 Trusted IO 기능
소프트웨어 스택 CPU, GPU, NPU 전반에 걸친 통합 AI 소프트웨어 스택
실시간 성능 공간 아키텍처로 실시간 성능 보장
어플리케이션 게임, 엔터테인먼트, 개인 AI 지원, 콘텐츠 제작, 기업 생산성

Curve Shaper를 사용한 Zen 5 데스크탑 오버클러킹

Ryzen 7000 시리즈의 대표적인 기능인 AMD의 Curve Optimizer를 통해 사용자는 PMFW/PBO 인식 동적 전압 스케일링 또는 언더볼팅을 활성화할 수 있습니다. 이 강력한 도구는 조정 가능한 "곡선 최적화" 단계를 통해 전압 곡선을 동적으로 이동하여 주파수 스펙트럼 전반에 걸쳐 가변 전압을 제공하고 더 높은 주파수에 더 많은 전압을 할당합니다. 사용자는 코어별, CCD별 또는 CPU별로 이 최적화를 적용하여 CPU 성능과 효율성을 세부적으로 제어할 수 있습니다.

AMD는 Curve Optimizer의 기반을 바탕으로 사용자가 기본 전압 곡선을 재구성하여 언더볼팅 가능성을 최대화할 수 있는 정교한 기능인 Curve Shaper를 선보입니다. Curve Shaper는 이전 버전과 동일한 단계를 사용합니다. 그럼에도 불구하고 사용자는 15개의 개별 주파수-온도 대역(XNUMX개의 온도 대역과 XNUMX개의 주파수 대역)에서 단계를 선택적으로 추가하거나 제거할 수 있는 유연성을 제공합니다. 이러한 미세 조정 기능을 통해 사용자는 불안정성이 관찰되는 영역에 전압을 추가하는 동시에 안정적인 대역의 전압을 더욱 줄일 수 있습니다. 모양이 변경된 곡선은 모든 코어에 균일하게 적용되며 곡선 최적화 프로그램을 사용하여 추가로 조정할 수 있습니다.

생각을 폐쇄

AMD Tech Day 2024는 제품 뒤의 엔지니어들과 함께 심층적으로 알아볼 수 있는 매우 감사한 기회를 얻은 훌륭한 이벤트였습니다. XDNA 2 아키텍처와 Zen 5 CPU를 통한 AMD의 최신 발전은 AI 및 고성능 컴퓨팅 혁명을 선도하겠다는 의지를 강조합니다. 코어 수, 스레딩, 전력 효율성 및 AI 가속의 획기적인 개선을 통해 AMD는 업계 표준을 재정의하고 현대 데이터 중심 워크로드의 증가하는 요구를 충족하여 데스크탑, 모바일, 서버 및 데이터 센터 애플리케이션 전반에 걸쳐 광범위한 성능을 보장합니다.

AMD의 더보기

StorageReview에 참여

뉴스레터 | 유튜브 | 팟캐스트 iTunes/스포티 파이 | 인스타그램 | 트위터 | 틱톡 서비스 | RSS 피드