[이코노믹데일리] SK텔레콤이 글로벌 빅테크의 AI 모델보다 한국어 능력이 뛰어나다고 자신하는 자체 거대언어모델(LLM) ‘에이닷 엑스 4.0’을 상업용 오픈소스로 전격 공개했다. 국내 기업들에 데이터 유출 걱정 없는 고성능 AI 선택지를 제공하며 시장의 주도권을 확보하겠다는 강력한 ‘AI 주권’ 전략이다.
SK텔레콤은 3일 개발자 커뮤니티 허깅페이스를 통해 720억개 매개변수의 표준 모델과 70억개 경량 모델 2종을 공개했다. 이번에 공개된 모델은 알리바바의 오픈소스 ‘큐원 2.5’를 기반으로 방대한 고품질 한국어 데이터를 추가 학습시킨 것이다. 기업이 외부망 연동 없이 내부 서버에 직접 설치해 사용할 수 있어 데이터 보안에 민감한 금융, 공공 기관에 매력적인 대안이 될 수 있다.
성능은 글로벌 최고 모델을 넘어선다. SK텔레콤은 자체 설계한 토크나이저(Tokenizer·문장의 구조를 분석해 토큰으로 분할하는 작업 도구)를 통해 GPT-4o 대비 토큰 처리 효율성을 33% 높여 비용 경쟁력을 확보했다. 대표적인 한국어 능력 평가 지표인 ‘KMMLU’와 한국 문화 이해도를 측정하는 ‘CLIcK’ 벤치마크에서도 GPT-4o(80.2점)를 능가하는 83.5점을 기록하며 한국어와 한국 문화에 대한 깊은 이해도를 입증했다.
이번 공개는 단순한 기술 과시를 넘어 국내 AI 생태계의 판도를 바꾸려는 전략적 행보다. 그동안 막대한 비용과 데이터 보안 문제로 글로벌 빅테크의 LLM 도입을 망설였던 기업들에 파생 모델 개발과 연구 등 다양한 활용의 길을 열어준 셈이다. SK텔레콤은 이미 자사 ‘에이닷’ 서비스에 해당 모델을 적용했으며 향후 SK그룹 전체로 확산할 계획이다.
SK텔레콤은 여기서 멈추지 않고 이달 중 수학과 코드 개발에 특화된 추론형 모델을 추가 공개하며 기술 격차를 벌려 나갈 예정이다. 또한 ‘소버린 AI’ 관점에서 밑바닥부터 자체 개발하는 ‘프롬 스크래치’ 방식의 모델 개발도 병행하며 장기적인 기술 독립까지 추진한다.
김지원 SK텔레콤 AI 모델 랩장은 “SK텔레콤의 다양한 서비스를 고도화하고, 기업 시장에서 한국어 특화 LLM으로 국내 비즈니스 환경에 최적화된 모델이 될 수 있도록 지속적인 기술 개발을 추진할 계획”이라고 말했다.
Copyright © 이코노믹데일리, 무단전재·재배포 금지