'12단 쌓은 D램' '세계 첫 양산'…韓반도체 'HBM 전장'된 엔비디아 GTC
최영지
입력 2024. 3. 19. 17:49수정 2024. 3. 19. 19:38
타임톡 8
음성으로 듣기
번역 설정
글씨크기 조절하기
18일 美서 'GTC 2024' 개막…글로벌 빅테크 몰려
삼성전자, 전시장서 '업계최초' HBM3E 12H 제품 전시
SK하이닉스, HBM3E 첫 대량양산…"엔비디아 납품"
젠슨 황, '차세대 GPU' 블랙웰 첫 언급…시장확대 기대
[이데일리 최영지 기자·뉴욕=김상윤 특파원] 삼성전자와 SK하이닉스, 마이크론 등 메모리반도체 3사가 엔비디아의 연례 개발자 콘퍼런스인 ‘GTC 2024’에서 5세대 고대역폭메모리(HBM3E) 신제품 전시를 통해 자사 기술력을 뽐내는 데 집중하는 모양새다. 역대 최대 규모 행사인 만큼 글로벌 빅테크가 대거 참여해 메모리업체로선 HBM시장 점유율을 높일 수 있는 절호의 기회이기 때문이다. 이날 젠슨 황 엔비디아 최고경영자(CEO)가 HBM3E가 들어가는 기존 그래픽처리장치(GPU)인 H100를 잇는 제품인 ‘블랙웰’(B200)을 공개한 만큼 메모리 3사의 차세대 HBM 경쟁은 더욱 격화할 것으로 보인다.
<img alt='삼성전자는 업계 최초로 D램 칩을 12단까지 쌓은 5세대 고대역폭 메모리 HBM(HBM3E) 실물을 전시했다. (사진=연합뉴스)' class='thumb_g_article' data-org-src='https://t1.daumcdn.net/news/202403/19/Edaily/20240319193837124unmh.jpg' data-org-width='670' dmcf-mid='0OR12we7aU' dmcf-mtype='image' height='auto' src='https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202403/19/Edaily/20240319193837124unmh.jpg' width='658' style='display: block; width: 640px; margin: 0px auto; vertical-align: top;'>이미지 크게 보기
삼성전자는 업계 최초로 D램 칩을 12단까지 쌓은 5세대 고대역폭 메모리 HBM(HBM3E) 실물을 전시했다. (사진=연합뉴스)삼성·SK, 美서 HBM 1,2위 경쟁 치열…마이크론도 거센 추격
삼성전자(005930)와 SK하이닉스(000660)는 18일(현지시간) GTC 2024가 열린 미국 캘리포니아 새너제이 SAP컨벤션센터에 나란히 전시관을 마련해 HBM3E 제품을 대거 공개했다.
삼성전자는 지난달 말 업계 최초로 D램 칩을 12단까지 쌓은 HBM3E 제품을 개발했다고 알린 데 이어 이번 행사에서 처음으로 실물을 전시했다.
HBM은 D램 여러 개를 수직으로 연결해 데이터 처리 속도를 혁신적으로 끌어올린 고성능 메모리다. 1세대(HBM)-2세대(HBM2)-3세대(HBM2E)-4세대(HBM3)-5세대(HBM3E) 순으로 개발되고 있다. 24Gb(기가비트) D램 칩을 TSV(실리콘 관통 전극) 기술로 12단까지 적층해 업계 최대 용량인 36GB(기가바이트) HBM3E 12H를 구현한 것으로, SK하이닉스와의 시장 선점 경쟁에 한발 뒤처진 이후 내놓은 반격의 카드인 셈이다.
<iframe id="aswift_1" name="aswift_1" browsingtopics="true" sandbox="allow-forms allow-popups allow-popups-to-escape-sandbox allow-same-origin allow-s allow-top-navigation-by-user-activation" width="300" height="250" frameborder="0" marginwidth="0" marginheight="0" vspace="0" hspace="0" allowtransparency="true" scrolling="no" allow="attribution-reporting; run-ad-auction" src="https://googleads.g.doubleclick.net/pagead/ads?client=ca-pub-1682288257759598&output=html&h=250&slotname=3069272696&adk=1472924327&adf=4032686239&pi=t.ma~as.3069272696&w=300&lmt=1710916247&format=300x250&url=https%3A%2F%2Fv.daum.net%2Fv%2F20240319174922477&adtest=off&wgl=1&uach=WyJBbmRyb2lkIiwiMTEuMC4wIiwiIiwiU00tVDI5NU4iLCIxMjIuMC42MjYxLjExOSIsbnVsbCwwLG51bGwsIiIsW1siQ2hyb21pdW0iLCIxMjIuMC42MjYxLjExOSJdLFsiTm90KEE6QnJhbmQiLCIyNC4wLjAuMCJdLFsiR29vZ2xlIENocm9tZSIsIjEyMi4wLjYyNjEuMTE5Il1dLDBd&dt=1710916247441&bpp=93&bdt=2529&idt=93&shv=r20240314&mjsv=m202403140101&ptt=9&saldr=aa&abxe=1&prev_fmts=0x0&nras=1&correlator=7377814481883&frm=20&pv=1&ga_vid=93095330.1710916247&ga_sid=1710916247&ga_hid=2049761580&ga_fc=0&u_tz=540&u_his=14&u_h=601&u_w=962&u_ah=601&u_aw=962&u_cd=24&u_sd=1.331&dmc=2&adx=331&ady=1628&biw=962&bih=433&scr_x=0&scr_y=84&eid=44759876%2C44759927%2C44759842%2C95326317%2C95322183%2C95326919%2C31078663%2C31078665%2C31078668%2C31078670&oid=2&pvsid=2451821260501555&tmod=2080323411&uas=0&nvt=1&ref=https%3A%2F%2Fwww.google.com%2F&fc=1920&brdim=0%2C0%2C0%2C0%2C962%2C0%2C962%2C433%2C962%2C433&vis=1&rsz=%7C%7CoeEbr%7C&abl=CS&pfx=0&fu=0&bc=31&bz=1&td=1&psd=W251bGwsbnVsbCxudWxsLDNd&nt=1&ifi=2&uci=a!2&btvi=1&fsb=1&dtd=141" data-google-container-id="a!2" data-google-query-id="CPr6i9qbgoUDFd_KFgUdLKcPSQ" data-load-complete="true" style="left: 0px; absolute; top: 0px; border-width: 0px; border-style: initial; width: 300px; height: 250px;"></iframe>
엔비디아, 생성형 AI 최적화 ‘블랙웰’ GPU 발표…“이전 대비 성능 5배 향상” 권용만 기자 권용만 기자 입력 2024.03.19 11:55 다른 공유 찾기 기사스크랩하기 글씨크기인쇄하기 생성형AI 시대 거대언어모델 환경 최적화된 ‘블랙웰’ GPU 차원에서는 이전 세대 대비 최대 다섯 배 성능 메모리, GPU간 연결 등 인프라 전반에서 성능 강화 GB2
생성형AI 시대 거대언어모델 환경 최적화된 ‘블랙웰’ GPU 차원에서는 이전 세대 대비 최대 다섯 배 성능 메모리, GPU간 연결 등 인프라 전반에서 성능 강화 GB200, 멀티 GPU 환경에서 H200 대비 성능 30배 엔비디아가 ‘생성형 AI’ 시대에 최적화된 차세대 ‘블랙웰(Blackwell)’ 그래픽처리장치(GPU)와 플랫폼을 발표했다. ‘블랙웰’
엔비디아가 ‘생성형 AI’ 시대에 최적화된 차세대 ‘블랙웰(Blackwell)’ 그래픽처리장치(GPU)와 플랫폼을 발표했다. ‘블랙웰’ 기반 B200 텐서 코어 GPU는 기존 ‘호퍼’ 대비 트랜지스터 집적 수는 두 배 이상 증가했고, FP4 기반의 AI 성능은 호퍼의 FP8 대비 다섯 배까지 올라간 것이 돋보인다.
엔비디아는 18일(현지시각) 미국 캘리포니아주 새너제이 컨벤션 센터(SAP 센터)에서 열린 ‘GTC 2024’ 행사의 기조연설을 통해, 차세대 ‘블랙웰’ 아키텍처 기반 GPU와 플랫폼을 발표했다.
새로운 ‘블랙웰’ GPU는 두 개의 다이를 10TB/s 대역폭으로 연결해 하나의 GPU로 구성했으며, TSMC의 맞춤형 2레티클 제한 4NP 공정을 통해 제조된다. 탑재된 2세대 트랜스포머 엔진은 FP4 형식의 연산을 지원하며, 이전 세대 ‘호퍼’ 대비 FP8 기반 성능은 2.5배, FP4 사용시에는 5배 향상된 성능을 제공할 수 있다. 한편, 엔비디아는
한편, 엔비디아는 새로운 ‘블랙웰’ GPU 뿐만 아니라 노드에서 데이터센터 스케일에 이르는 다양한 구성 옵션을 함께 제시했다.
젠슨 황 엔비디아 CEO가 소개한 블랙웰 GPU (좌), 호퍼 GPU (우) / 엔비디아 GTC 기조연설 중계 영상 갈무리 젠슨 황 엔비디아 CEO는 “트랜스포머 모델이 등장한 이후 거대언어모델(LLM)의 크기는 6개월마다 두 배로 커지는 추세고, 성능에 대한 요구도 그만큼 커졌다.
엔비디아의 GPU 또한 이러한 요구에 따라 빠르게 성능을 높여 가고 있다. 2021년의 셀린(Selene) 슈퍼컴퓨터는 4480개의 A100 GPU로 3엑사플롭스(EFlops) 성능을 제공했지만, 2023년의 이오스(EOS)는 1만752개 H100 GPU로 43엑사플롭스 성능을 제공할 수 있을 정도로 성능과 확장성 측면에서 빠른 발전을 보였다고 덧붙였다.
‘호퍼(Hopper)’의 뒤를 잇는 차세대 GPU 아키텍처 명은 ‘블랙웰(Blackwell)’로, 미국의 통계학자이자 수학자인 ‘데이비드 헤롤드 블랙웰(David Harold Blackwell)’의 이름을 땄다.
이 ‘블랙웰’ 실리콘은 TSMC의 맞춤형 2레티클 제한 4NP 공정을 통해 제조되며, 개당 1040억 개의 트랜지스터를 집적했다. 실제 GPU는 이 실리콘 다이 두 개를 결합해 구성하며, 이 때 실리콘 수는 2080억개고, 다이간 연결 대역폭은 10TB/s에 이른다.
이렇게 ‘초대형’ 패키지로 등장한 블랙웰 GPU는 칩당 최대 20페타플롭스(PFlops) 연산 성능을 제공한다. 메모리는 192기가바이트(GB) 용량의 HBM3e를 탑재해, 이전 세대보다 두 배 이상 높아진 8TB/s의 메모리 대역폭을 제공한다.
엔비디아는 이전 세대의 ‘호퍼’와 비교하면, 블랙웰 GPU는 호퍼보다 트랜지스터 수는 1280억개 더 많고, 온-다이(on-die) 메모리는 4배 증가했으며, AI 성능은 5배까지 높아졌다고 소개했다.
이 블랙웰 GPU는 두 가지 구성으로의 활용이 가능하다. 먼저, 기존 ‘호퍼’ 기반 인프라 설계에 호환되는 HGX 구성에 블랙웰 GPU를 적용할 수 있다. 이와 함께, 새로운 구성으로는 두 개의 블랙웰 GPU와 하나의 그레이스 CPU를 조합한 형태로 사용할 수 있다.
이 조합에서는 각각 900GB/s 대역폭으로 연결된 CPU와 GPU가 384GB의 HBM3e 메모리 전체를 공유해 사용할 수 있다. 한편 이 조합을 하나의 패키징으로 구현한 ‘GB200 그레이스 블랙웰 슈퍼칩’은 HBM을 포함해 유닛당 총 864GB의 메모리를 갖추고, 3.6TB/s의 NV링크 대역폭을 제공한다.
엔비디아 블랙웰 GPU / 엔비디아 블랙웰 GPU에 탑재된 2세대 트랜스포머 엔진은 새로운 FP6, FP4 연산을 지원해, LLM과 생성형 AI 등에서 이전 세대보다 큰 성능 향상을 제공한다.
젠슨 황 CEO는 “이제 생성형 AI 시대를 위한 새로운 기준과 구조가 필요하다. 블랙웰 GPU가 지원하는 FP4는 생성형 AI의 토큰 생성과 추론 성능에서 실질적인 성능 향상을 제공할 것이다”라고 밝혔다.