머숨 미러

아래 비교는 CES 2026에서 각사가 공개한 “랙(72 GPU) 기준” 수치를 기준으로 정리했습니다. (한국시간 기준으로는 2026-01-06 전후 발표 흐름입니다.) NVIDIA의 Vera Rubin 플랫폼 발표는 CES 2026에서 공개되었습니다. (The Verge)

1) 공식 공개 FP8(또는 FP8/FP6) 성능 수치AMD: MI450(계열) / Helios 랙

Helios(72개 MI450 Series GPU) 기준: FP8 최대 1.4 exaFLOPS(= 1,400 PFLOPS), 총 HBM4 31 TB, 총 메모리 대역폭 1.4 PB/s (AMD)
CES 2026에서 언급된 Helios 구성은 **72개 MI455X(= MI400 패밀리, MI450 계열 라인업)**로 소개되며, **FP8 1.4 exaFLOPS(학습)**로 제시되었습니다. (Tom's Hardware)

질문이 “MI450”이지만, CES 현장에서는 Helios에 MI455X가 함께 언급됩니다(동일 세대/패밀리로 묶이는 랙 스케일 지표). (Tom's Hardware)

NVIDIA: Vera Rubin / DGX Vera Rubin NVL72

DGX Vera Rubin NVL72(72 Rubin GPU) 기준: FP8/FP6 Training 1,260 PFLOPS(= 1.26 exaFLOPS), 총 HBM4 20.7 TB (NVIDIA)

2) 같은 “72-GPU 랙” 기준 FP8 성능 비교(단순 비율)

AMD: 1,400 PFLOPS (FP8) (AMD)
NVIDIA: 1,260 PFLOPS (FP8/FP6 Training) (NVIDIA)

따라서 랙 단위의 공개 수치만 놓고 보면,

AMD가 FP8 기준 약 +11.1% 높음 (1,400 / 1,260 ≈ 1.111)

또한 “GPU 1개당 평균”으로 단순 정규화하면:

AMD: 1,400 ÷ 72 ≈ 19.4 PFLOPS/GPU
NVIDIA: 1,260 ÷ 72 = 17.5 PFLOPS/GPU
(단, 둘 다 랙/시스템 기준 공개치에서 역산한 평균입니다. (AMD))

3) 해석 시 주의점(실사용 성능에 큰 영향을 주는 변수)

지표 정의 차이: NVIDIA는 명확히 **“FP8/FP6 Training”**으로 표기합니다. (NVIDIA) AMD는 Helios에 대해 FP8 수치를 제시하면서(학습으로도 언급됨) “성능” 표현이 함께 등장합니다. (Tom's Hardware)
FP8만으로 승부가 끝나지 않음: NVIDIA는 같은 스펙 페이지에서 NVFP4 Training/Inference도 크게 강조합니다(예: NVFP4 Training 2,520 PFLOPS). (NVIDIA) 즉, 실제 워크로드가 FP8을 고집하느냐, FP6/FP4까지 쓰느냐에 따라 체감 우위가 달라집니다.
메모리 용량: AMD Helios는 31TB HBM4, NVIDIA NVL72는 20.7TB HBM4로 공개되어, 대형 모델/긴 컨텍스트/배치 구성에서는 AMD 쪽이 유리한 시나리오가 생길 수 있습니다. (AMD)

원하시면, 다음 단계로 (a) FP8 학습에서 실제로 성능을 좌우하는 병목(메모리/통신/커널) 기준, (b) “FP8 FLOPS vs tokens/s(모델별)”로 비교할 때 체크리스트, **(c) MI450/MI455X vs Rubin에서 예상되는 최적 워크로드(예: MoE, 긴 컨텍스트, 멀티노드 스케일아웃)**까지 정리해드릴 수 있습니다.

띵킹 해비 검색키고 돌렷는데 이렇다네?
뭐 대충 걸러들으셈 일단 링크된 공식 홈페이지 들어가보면

Powered by the AMD CDNA™ architecture, each MI450 Series GPU delivers up to 432 GB of HBM4 memory and 19.6 TB/s of memory bandwidth, providing industry-leading capacity and bandwidth for data-hungry AI models. At rack scale, a “Helios” system with 72 MI450 Series GPUs delivers up to 1.4 exaFLOPS of FP8 and 2.9 exaFLOPS of FP4 performance, with 31 TB of total HBM4 memory and 1.4 PB/s of aggregate bandwidth — a generational leap that enables trillion parameter training and large scale AI inference.

amd 자료고
아래가 엔비디아인데 동일 갯수 랙인데 amd가 더좋음 ㄷㄷ

a15714ab041eb360be3335625683746f02534528d6a6ed89d53761f79e15cd6e463decf4ab8be3596e378d31df

그럼 fp8 기준으로 amd 72 mi450 이 1.4엑사플롭스 , nvdia 베라루빈 72가 1.26엑사플롭스임 ㄷㄷ

원래 동시기 출시 하드웨어만 따지면 AMD가 더 좋았음 ㅋㅋ cuda 생태계 덕분에 압도한 거지

메론맛콜라가먹고싶어(victim4811) 2026-01-06 22:38:00

답글

POKUDONS(allow4383) 2026-01-06 22:40:00

해당 댓글은 삭제되었습니다.

해당 댓글은 삭제되었습니다. 2026-06-27 09:03:29.226926

ㄷㄷ 난 엔비디아가 더좋을줄 뭔가 압도적인줄 알앗는데

POKUDONS(allow4383) 2026-01-06 22:41:00

1개로는 좋아도 수십만개 연결되었을때 오케스트라처럼 하나로 동작하냐는 다른 얘기

익명(wanted7407) 2026-01-06 23:17:00

nvlink가 압도적일껄요? - dc App

냥쓰(kalstein) 2026-01-07 08:26:00

[일반] 뭐야 mi450이 베라루빈보다 좋은건가?

댓글 6

[일반] 뭐야 mi450이 베라루빈보다 좋은건가?

댓글 6

다른 게시글

로봇 대량생산체제

뭔가 이상해...

진정한 세계평화를 실천하고 혐오를 완전히 없앨려면 완몰가 상용화가 필수임

ai 노래 작곡은 유료로 해줬으면

2월에는 뭐나옴??

opus vs 젬미니 딥리서치 뭐가나음

짱개들 희토류는 그닥 효과 없을거다

교도소 이야기 나오니까 하는 말인데

우리이제 양반처럼되는건가?

AI를 활용해 산성환경에서 12배 더 안정적인 루테늄 촉매를 찾다