IT

kt cloud, GPUaaS에 엔비디아 H200 GPU 탑재… 고성능 AI 인프라 '최적화'

선재관 기자 2025-02-24 10:22:28
'AI Train' 서비스에 H200 적용… AI 인프라 성능 '대폭 강화' NPU 기반 'AI SERV NPU' 서비스 확장… "AI 서비스 포트폴리오 지속 강화"
kt cloud H200 도입 관련
[이코노믹데일리] kt cloud가 GPUaaS(GPU as a Service)에 최신 엔비디아 H200 GPU를 도입하며 고객에게 더욱 강력하고 효율적인 고성능 AI 인프라를 제공한다고 24일 밝혔다. 이번 H200 GPU 도입은 kt cloud가 AI 인프라 시장에서 기술 경쟁력을 한층 강화하고 빠르게 변화하는 고객의 수요에 발맞추기 위한 행보로 풀이된다.

kt cloud는 공공기관과 AI 스타트업 등 AI 인프라를 필요로 하는 다양한 고객층을 대상으로 사용량 기반의 GPUaaS를 제공하고 있다. 특히 단기간에 고성능 GPU 자원이 필요한 학습 영역에 특화된 ‘AI Train’과 상시적인 GPU 자원 공급이 중요한 추론 영역에 최적화된 ‘AI SERV’ 등 엔비디아 GPU 기반의 다양한 상품 라인업을 구축하여 고객 맞춤형 서비스를 제공해왔다.

이번에 H200 GPU가 적용되는 서비스는 ‘AI Train’이다. kt cloud는 기존 H100 GPU 중심으로 운영되던 ‘AI Train’ 서비스에 H200 GPU를 추가함으로써 AI 인프라 성능을 대폭 향상시킨다는 계획이다. 이미 다수의 고객 레퍼런스를 통해 대규모 GPU 노드 클러스터링 및 동적 할당 제어 기능을 검증받은 ‘AI Train’은 H200 GPU 도입을 통해 더욱 강력한 AI 학습 환경을 제공할 수 있게 되었다.

엔비디아 H200 GPU는 최신 호퍼(Hopper) 아키텍처 기반으로 개발된 최첨단 GPU로 AI 및 고성능 컴퓨팅(HPC) 워크로드 처리 성능을 극대화하는 데 초점을 맞춘 제품이다. H200 GPU는 이전 모델인 H100 대비 연산 처리 능력과 전력 효율성이 향상되었으며 메모리 대역폭 또한 크게 확장되어 AI 학습 및 추론 환경을 획기적으로 개선할 것으로 기대된다.

kt cloud는 GPU뿐만 아니라 NPU(Neural Processing Unit) 기반 서비스로도 영역을 확장하고 있다. 리벨리온과의 협력을 통해 추론 전용 인프라 서비스인 ‘AI SERV NPU’를 제공 중이며 올해 5월 출시 예정인 리벨리온의 차세대 NPU ‘아톰 맥스’를 ‘AI SERV NPU’에 적용하여 소형언어모델(sLM) 성능 검증을 진행할 예정이다. 

더불어 미국 반도체 설계 기업 암페어(Ampere)와 AI 반도체 사업 협력을 논의하는 등 다양한 업계 파트너들과의 협력을 통해 AI 사업 영역을 지속적으로 확장해 나갈 계획이다.

한편 kt cloud는 공공 분야 AI 시장 공략에도 박차를 가한다. 올 하반기 공공기관 대상 추론 전용 상품에 대한 CSAP(클라우드 보안 인증) 획득을 추진하여 공공 분야의 AI 수요 증가에 적극적으로 대응한다는 방침이다.

공용준 kt cloud Cloud본부장은 “이번 엔비디아 H200 GPU 도입은 kt cloud가 글로벌 수준의 AI 인프라 경쟁력을 확보하는 중요한 계기가 될 것”이라며 “향후 AI 인프라뿐만 아니라 AI Ops 등 AI 서비스 포트폴리오를 지속적으로 강화하고 기술 경쟁력 향상을 통해 다양한 고객의 니즈를 충족시켜 나가겠다”고 밝혔다.