IT

마이크로소프트, AI 혁신 위한 '애저 ND GB200 V6' 공개

선재관 기자 2024-11-20 10:32:19
블랙웰 GPU 기반 초고성능 AI 슈퍼컴퓨팅 플랫폼 발표 AI 가속기 '마이아'와 친환경 솔루션 '콜뱃'
[이코노믹데일리] 마이크로소프트(MS)가 엔비디아의 최신 블랙웰(Blackwell) GPU를 탑재한 AI 인프라를 공개하며 AI 슈퍼컴퓨팅 시대의 새로운 기준을 제시했다. 20일 연례 개발자 컨퍼런스 '이그나이트 2024'에서 '애저 ND GB200 V6'를 선보이며 수십만 개의 GPU를 네트워크로 연결해 역대 최대 성능을 제공한다고 밝혔다.

애저 ND GB200 V6는 최신 대규모 언어 모델(LLM)과 기타 AI 애플리케이션을 위한 맞춤형 클라우드 서버다. 이 시스템은 엔비디아의 GB200 슈퍼칩을 중심으로 설계됐으며 두 개의 블랙웰 GPU와 그레이스 CPU를 NV링크-C2C로 연결해 뛰어난 데이터 처리 속도를 자랑한다. 이를 통해 수조 개의 매개변수를 처리할 수 있는 강력한 성능과 함께 프로그래밍 단순화를 구현했다.

 
엔비디아 블랙웰을 도입한 애저 ND GB200 V6를 소개하는 사티아 나델라 MS CEO.[사진=MS]

사티아 나델라 CEO 는 "애저 ND GB200 V6는 대규모 AI 모델 학습과 추론 속도를 혁신적으로 높여 클라우드에서 AI 기술의 새로운 표준을 수립할 것"이라고 강조했다. 이 시스템은 기존 대비 최대 2배의 성능 향상과 강화된 데이터 보안을 제공하며 의료, 금융, 국방 등 고도로 민감한 분야에 적합하다.

현장에서는 AMD와 공동 개발한 '애저 HBv5 VM'도 함께 공개됐다. 이 플랫폼은 AMD의 최신 에픽(EPYC) 9V64H 프로세서를 기반으로 하며 고대역폭 메모리와 고성능 젠(Zen)4 코어를 탑재해 기존 대비 최대 35배 빠른 속도를 제공한다. 특히 기상 모델링, 항공우주 시뮬레이션 등 고도의 계산력을 요구하는 작업에도 최적화됐다.

HBv5 VM은 엔비디아 인피니밴드 네트워킹을 활용해 수많은 GPU를 연결하며 온프레미스 시스템 대비 최대 8배 높은 성능을 제공한다고 MS는 설명했다.

MS는 또한 자체 설계한 AI 가속기 '마이아(Maia)'와 Arm 기반 프로세서 '콜뱃(Cobalt)'도 발표했다. 마이아는 애저 클라우드에서 AI 워크로드를 처리하도록 설계된 최초의 맞춤형 가속기로 현재 애저 오픈AI 추론 작업을 담당하고 있다. 콜뱃은 전력 소비를 40% 줄이며 에너지 효율성을 극대화한 솔루션이다.

사티아 나델라 CEO는 "마이아는 MS의 가장 영향력 있는 서비스 처리에 핵심적인 역할을 하고 있다"고 말했다.

한편 MS는 AI 기술 발전과 더불어 보안 인프라 강화에도 중점을 두고 있다. 이번에 공개된 하드웨어 보안 모듈(HSM)은 데이터 암호화와 키 관리를 위한 전용 하드웨어로 애저 데이터 센터 전반에 적용된다. 또한 애저부트DPU(ADP)는 클라우드 네트워크 부하를 완화하며 전력 소비를 기존 대비 3분의 1로 줄이고 성능을 최대 4배 향상시킨다.

사티아 나델라 CEO는 "비용 대비 성능 극대화와 효율성 향상은 클라우드 환경의 핵심"이라며 "우리는 업계 파트너들과 함께 지속적인 혁신을 통해 최적의 환경을 제공하고 있다"고 덧붙였다.