아래 비교는 CES 2026에서 각사가 공개한 “랙(72 GPU) 기준” 수치를 기준으로 정리했습니다. (한국시간 기준으로는 2026-01-06 전후 발표 흐름입니다.) NVIDIA의 Vera Rubin 플랫폼 발표는 CES 2026에서 공개되었습니다. (The Verge)
1) 공식 공개 FP8(또는 FP8/FP6) 성능 수치AMD: MI450(계열) / Helios 랙Helios(72개 MI450 Series GPU) 기준: FP8 최대 1.4 exaFLOPS(= 1,400 PFLOPS), 총 HBM4 31 TB, 총 메모리 대역폭 1.4 PB/s (AMD)
CES 2026에서 언급된 Helios 구성은 **72개 MI455X(= MI400 패밀리, MI450 계열 라인업)**로 소개되며, **FP8 1.4 exaFLOPS(학습)**로 제시되었습니다. (Tom's Hardware)
질문이 “MI450”이지만, CES 현장에서는 Helios에 MI455X가 함께 언급됩니다(동일 세대/패밀리로 묶이는 랙 스케일 지표). (Tom's Hardware)
NVIDIA: Vera Rubin / DGX Vera Rubin NVL72DGX Vera Rubin NVL72(72 Rubin GPU) 기준: FP8/FP6 Training 1,260 PFLOPS(= 1.26 exaFLOPS), 총 HBM4 20.7 TB (NVIDIA)
따라서 랙 단위의 공개 수치만 놓고 보면,
AMD가 FP8 기준 약 +11.1% 높음 (1,400 / 1,260 ≈ 1.111)
또한 “GPU 1개당 평균”으로 단순 정규화하면:
AMD: 1,400 ÷ 72 ≈ 19.4 PFLOPS/GPU
NVIDIA: 1,260 ÷ 72 = 17.5 PFLOPS/GPU
(단, 둘 다 랙/시스템 기준 공개치에서 역산한 평균입니다. (AMD))
지표 정의 차이: NVIDIA는 명확히 **“FP8/FP6 Training”**으로 표기합니다. (NVIDIA) AMD는 Helios에 대해 FP8 수치를 제시하면서(학습으로도 언급됨) “성능” 표현이 함께 등장합니다. (Tom's Hardware)
FP8만으로 승부가 끝나지 않음: NVIDIA는 같은 스펙 페이지에서 NVFP4 Training/Inference도 크게 강조합니다(예: NVFP4 Training 2,520 PFLOPS). (NVIDIA) 즉, 실제 워크로드가 FP8을 고집하느냐, FP6/FP4까지 쓰느냐에 따라 체감 우위가 달라집니다.
메모리 용량: AMD Helios는 31TB HBM4, NVIDIA NVL72는 20.7TB HBM4로 공개되어, 대형 모델/긴 컨텍스트/배치 구성에서는 AMD 쪽이 유리한 시나리오가 생길 수 있습니다. (AMD)
원하시면, 다음 단계로 (a) FP8 학습에서 실제로 성능을 좌우하는 병목(메모리/통신/커널) 기준, (b) “FP8 FLOPS vs tokens/s(모델별)”로 비교할 때 체크리스트, **(c) MI450/MI455X vs Rubin에서 예상되는 최적 워크로드(예: MoE, 긴 컨텍스트, 멀티노드 스케일아웃)**까지 정리해드릴 수 있습니다.
띵킹 해비 검색키고 돌렷는데 이렇다네?
뭐 대충 걸러들으셈 일단 링크된 공식 홈페이지 들어가보면
Powered by the AMD CDNA™ architecture, each MI450 Series GPU delivers up to 432 GB of HBM4 memory and 19.6 TB/s of memory bandwidth, providing industry-leading capacity and bandwidth for data-hungry AI models. At rack scale, a “Helios” system with 72 MI450 Series GPUs delivers up to 1.4 exaFLOPS of FP8 and 2.9 exaFLOPS of FP4 performance, with 31 TB of total HBM4 memory and 1.4 PB/s of aggregate bandwidth — a generational leap that enables trillion parameter training and large scale AI inference.
amd 자료고
아래가 엔비디아인데 동일 갯수 랙인데 amd가 더좋음 ㄷㄷ
그럼 fp8 기준으로 amd 72 mi450 이 1.4엑사플롭스 , nvdia 베라루빈 72가 1.26엑사플롭스임 ㄷㄷ
원래 동시기 출시 하드웨어만 따지면 AMD가 더 좋았음 ㅋㅋ cuda 생태계 덕분에 압도한 거지
해당 댓글은 삭제되었습니다.
ㄷㄷ 난 엔비디아가 더좋을줄 뭔가 압도적인줄 알앗는데
1개로는 좋아도 수십만개 연결되었을때 오케스트라처럼 하나로 동작하냐는 다른 얘기
nvlink가 압도적일껄요? - dc App