전체메뉴 검색
IT

SKT, '소버린 AI'를 향한 기술 과시...한 달 새 6개 모델 공개

선재관 기자 2025-07-29 16:17:45

시각 AI 'A.X 4.0 VL' 및 학습 가속 'A.X 인코더' 오픈소스로 공개

[사진=SKT]

[이코노믹데일리] SK텔레콤이 국내 ‘소버린 AI(Sovereign AI)’ 생태계 구축을 위한 기술적 리더십 확보에 총력전을 펼치고 있다. 이달에만 연달아 4개의 거대언어모델(LLM)을 공개한 데 이어 산업 현장의 시각 정보를 정교하게 이해하는 시각-언어모델(VLM)과 LLM의 학습 및 추론 속도를 획기적으로 개선하는 핵심 기반 기술까지 오픈소스로 풀며 기술력 과시에 나섰다.

SKT는 자사 AI 모델 ‘에이닷 엑스(A.X)’를 기반으로 개발한 ‘A.X 4.0 VL 라이트’와 범용 문서 해석 기술 ‘A.X 인코더’ 2종을 글로벌 오픈소스 커뮤니티 허깅페이스에 공개했다고 29일 밝혔다. 

이번 공개는 단순한 모델 추가를 넘어 국내 기업과 개발자들이 AI를 실제 산업에 적용하고 자체 모델을 개발하는 데 필요한 핵심 도구를 제공하겠다는 전략적 의지가 담겨있다. 이는 정부가 추진하는 ‘독자 AI 파운데이션 모델’ 사업을 겨냥한 행보로 SKT가 기술 생태계의 중심축이 되겠다는 선언으로 풀이된다.

이번에 공개된 기술 중 가장 주목받는 것은 시각-언어모델인 ‘A.X 4.0 VL 라이트’다. 이 모델은 텍스트를 넘어 이미지, 도표, 그래프, 심지어 복잡한 제조 도면까지 ‘보고 이해하는’ 능력을 갖췄다. SKT의 70억 매개변수 경량 모델인 ‘A.X 4.0 라이트’를 기반으로 개발돼 비교적 적은 컴퓨팅 자원으로도 높은 성능을 낼 수 있도록 설계됐다.

성능은 예상을 뛰어넘는다. SKT에 따르면 이 모델은 한국어 시각 벤치마크에서 중국의 320억 매개변수 대형 모델인 ‘큐원(Qwen) 2.5-VL’보다 더 우수한 점수를 기록했다. 훨씬 작은 모델 크기에도 불구하고 더 높은 성능을 달성한 것은 SKT의 학습 데이터와 튜닝 기술력이 글로벌 수준에 도달했음을 의미한다. 특히 한국의 복잡한 문서 구조와 차트 등을 이해하는 ‘KoBizDoc’ 벤치마크에서도 대형 모델과 대등한 성능을 보여 국내 기업 환경에서의 활용 가치를 증명했다.

비용 효율성 또한 강점이다. 동일한 한국어 데이터를 처리할 때 경쟁 모델 대비 텍스트 토큰 사용량을 41%나 줄여 기업들이 AI를 활용하는 데 가장 큰 장벽인 운영 비용을 크게 낮출 수 있다.

이와 함께 공개된 ‘A.X 인코더’는 LLM의 성능과 효율을 좌우하는 핵심 기반 기술이다. 인코더는 인간의 언어를 AI가 이해할 수 있는 벡터 값으로 변환하는 역할을 하는데 이 과정의 효율이 AI의 전체 성능을 결정한다.

‘A.X 인코더’의 가장 큰 특징은 한 번에 처리할 수 있는 정보의 양, 즉 ‘컨텍스트 창’을 획기적으로 늘렸다는 점이다. 기존 모델들이 통상 512 토큰(수십 개 문장)을 처리했다면 ‘A.X 인코더’는 1만 6384 토큰까지 처리할 수 있다. 이는 단편적인 문단이 아닌 책 한 권에 가까운 긴 문서를 한 번에 읽고 맥락을 파악할 수 있다는 의미다.

이러한 능력은 LLM의 학습 속도를 최대 2배, 사용자의 질문에 답하는 추론 속도를 최대 3배까지 끌어올린다. 대규모 문서를 학습시켜야 하는 기업이나 연구기관에겐 개발 기간과 비용을 극적으로 단축할 수 있는 강력한 무기가 생긴 셈이다. 이 인코더는 1억4900만개의 매개변수만으로 자연어 이해 성능지표에서 글로벌 최고 수준(SOTA)급 점수를 달성해 효율성과 성능을 모두 잡았다.

김태윤 SK텔레콤 파운데이션 모델 담당은 “독자적인 기술력 확보가 소버린 AI의 핵심인 만큼 자체 역량을 높이고 컨소시엄 기업들과의 협업에도 박차를 가해 글로벌 최고 수준의 AI 경쟁력을 확보할 것”이라고 강조했다. SKT의 전례 없는 한 달간의 기술 공개 릴레이는 국내 AI 시장의 패권을 잡기 위한 치열한 경쟁의 서막을 알리고 있다.
0개의 댓글
0 / 300
댓글을 삭제 하시겠습니까?
닫기
로그인 후 댓글작성이 가능합니다.
로그인 하시겠습니까?
닫기
기사 이미지 확대 보기
닫기