IT

SKT, 519B 초거대 AI 'A.X K1' 기술 보고서 공개

류청빛 기자 2026-01-07 11:31:04
4개월 개발·1000개 GPU로 완성 MoE 구조 적용해 효율 극대화
[사진=SKT]

[이코노믹데일리] SK텔레콤은 SK텔레콤 정예팀이 제작한 매개변수 519B(5190억개) 규모의 초거대 AI 모델 'A.X K1' 기술 보고서를 오픈소스 플랫폼 허깅페이스에 공개했다고 7일 밝혔다.

이번 모델은 4개월여의 개발 기간과 제한된 GPU 자원 속에서 완성된 국내 첫 500B 이상 초거대 AI 모델이다. SK텔레콤 정예팀은 효율 중심의 설계를 통해 대규모 연산 자원 투입 없이도 고성능을 구현하는 데 초점을 맞췄다.

이 모델은 주요 벤치마크에서 딥시크-V3.1 등 글로벌 초거대 오픈소스 모델과 유사하거나 일부 지표에서는 더 높은 성능을 기록했다. 매개변수 규모가 커질수록 학습 비용이 급증하는 점을 고려하면 상대적으로 제한된 자원으로 경쟁력 있는 성능을 확보했다고 평가받는다.

SK텔레콤 정예팀은 약 1000개의 GPU를 활용해 학습을 진행했으며 스케일링 이론에 기반해 최적의 모델 크기와 학습량을 설계했다. 정부 지원 없이 자체 GPU 조달만으로 개발을 완료한 점도 특징이다. 학습에는 웹·코드·이공계(STEM)·추론 데이터 등 고품질 데이터가 활용됐고, 한국어 특화 데이터와 커리큘럼 학습 방식도 적용됐다.

성능 평가 결과 A.X K1은 수학 능력을 측정하는 AIME25 벤치마크에서 딥시크-V3.1을 상회하는 점수를 기록했으며 실시간 코딩 문제 해결 능력을 평가하는 '라이브 코드 벤치'에서도 영어·한국어 모두 높은 성능을 보인 것으로 알려졌다.

A.X K1은 전체 519B 매개변수 중 일부만 선택적으로 활성화하는 전문가 혼합(MoE) 구조를 적용해 효율성을 높였으며 최대 128K 토큰의 긴 문맥 처리도 지원한다. SKT는 향후 멀티모달 기능을 추가하고 조 단위 매개변수 모델로 확장하는 방안을 검토하고 있다.

김태윤 SK텔레콤 파운데이션 모델 담당은 "A.X K1 모델은 챗봇 형태 외에 다양한 형태의 서비스에 적용할 수 있다"며 "글로벌 AI 3강과 모두의 AI 실현을 위한 노력을 지속할 것"이라고 말했다.