https://www.aitimes.com/news/articleView.html?idxno=205396
네이버(대표 최수연)는 엔비디아 GPU ‘B200(블랙웰)’ 4000장으로 국내 최대 규모의 AI 컴퓨팅 클러스터 구축을 완료, 자체 AI 모델과 서비스 개발에 활용한다고 8일 밝혔다.
네이버는 이번 인프라 구축을 통해 글로벌 수준의 컴퓨팅 파워를 확보하는 데 성공했다고 전했다. 앞서 SK텔레콤은 B200 1000장 규모 클러스터를 구축한 바 있으며, B200 4000장 클러스터는 국내 최대 규모에 해당한다.
이는 독자 파운데이션 모델 고도화와 서비스, 산업 적용 등에 활용할 계획이다.
단순 장비 도입을 넘어 대규모 GPU 자원을 하나로 연결해 최적의 성능을 끌어내는 '클러스터링' 분야 기술을 보유하고 있다고 강조했다. 지난 2019년 엔비디아의 슈퍼컴퓨팅 인프라인 ‘슈퍼팟(SuperPod)’을 세계에서 가장 빠르게 상용화한 것은 물론, 초고성능 GPU 클러스터를 직접 설계하고 운영하는 등 실증 경험을 축적해 왔다는 설명이다.
이번에 구축한 'B200 4K 클러스터'에는 이런 노하우를 집약해 냉각과 전력, 네트워크 최적화 기술을 반영했다고 전했다. 대규모 병렬 연산과 고속 통신을 전제로 설계, 글로벌 톱500 상위권 슈퍼컴퓨터들과 비교 가능한 수준의 컴퓨팅 규모를 갖췄다고 소개했다.
이에 따라 AI 모델 개발 속도부터 빨리질 것으로 예상했다. 내부 시뮬레이션 결과, 720억(72B) 매개변수 모델 학습 시 기존 'A100' 인프라(2048장)로 약 18개월이 소요되던 학습 기간을 이번 B200 4K 클러스터에서는 1.5개월 수준으로 단축한 것으로 나타났다. 이는 내부 시뮬레이션 결과로, 실제 학습 과제와 설정에 따라 기간은 달라질 수 있다고 덧붙였다.
이처럼 학습 효율이 12배 이상 향상하면서, AI 파운데이션 모델의 완성도를 높이고 변화하는 기술 환경에 기민하게 대응할 수 있는 체계를 갖추게 됐다고 밝혔다.
현재 진행 중인 독자 파운데이션 모델 고도화에 속도를 낼 계획이며, 텍스트를 넘어 이미지·비디오·음성을 동시에 처리하는 옴니(Omni) 모델 학습을 대규모로 확장한다는 전략이다. 다양한 서비스와 산업 현장에도 단계적인 적용에 나선다.
최수연 네이버 대표는 “이번 AI 인프라 구축은 단순 기술 투자를 넘어, 국가 차원의 AI 경쟁력과 AI 자립·주권을 뒷받침하는 핵심 자산을 확보했다는 데 의미가 있다”라며 “빠른 학습과 반복 실험이 가능한 인프라를 바탕으로, AI 기술을 서비스와 산업 현장에 보다 유연하게 적용해 실질적인 가치를 만들어 나갈 것”이라고 말했다.
출처 : AI타임스(https://www.aitimes.com)
헐
탑500이면 위로 슈퍼컴 개많긴하네;;
네이버에 주는 gpu가 제닐 아깝다