[이코노믹데일리] 네이버클라우드는 3일 초대규모 AI '하이퍼클로바X(HyperCLOVA X)'의 테크니컬 리포트를 공개하며 기술력을 입증했다. 리포트에 따르면 하이퍼클로바X는 한국어, 상식, 수학, 코딩 등 다양한 분야에서 글로벌 오픈소스 모델보다 높은 성능을 기록하며 소버린 AI로서 경쟁력을 확보했다.
테크니컬 리포트는 학습 방법, 성능 평가 결과 등 하이퍼클로바X의 기술적 특징을 자세히 설명한다. 성능 평가 결과, 하이퍼클로바X는 한국어, 일반상식, 수학, 코딩 부문에서 리포트에서 비교 평가를 위해 선정한 14개 모델 중 1위를 기록했다. 이는 하이퍼클로바X가 특정 국가 언어 능력뿐 아니라 보편 지식, 프로그래밍 등 다양한 분야 문제 해결력까지 갖춘 소버린 AI임을 보여주는 결과다.
폐쇄형(Closed-source) 모델들과의 비교에서도 하이퍼클로바X는 한국어 능력 부문에서 세계 최고 수준 모델을 포함한 4개 모델 중 1위, 영어 능력 부문에서 2위를 기록하며 우수한 성능을 입증했다.
리포트는 하이퍼클로바X의 높은 성능을 뒷받침하는 모델 학습 과정에 대해서도 설명한다. 하이퍼클로바X는 대부분 한국어, 영어, 코드 데이터로 구성된 양질의 사전학습(Pretraining) 데이터를 사용하며, 저품질 문서나 개인정보를 포함된 데이터는 제외했다. 또한 정렬학습(Alignment Learning)을 통해 사용자의 의도와 지시를 더 잘 이해하도록 모델을 고도화했다.
하이퍼클로바X의 또 다른 특징은 '다국어 능력(Multilinguality)'이다. 한국어와 영어 정보를 활용해 제3의 언어로 추론하는 능력을 갖춘 것이 확인됐다. 일본어, 아랍어, 힌디어, 베트남어 등 아시아 국가 언어 능력 평가에서도 하이퍼클로바X는 리포트에서 선정한 9개 모델 중 가장 높은 점수를 획득했다.
기계 번역 평가에서도 하이퍼클로바X는 한국어-일본어, 일본어-한국어 번역 능력에서 리포트에서 선정한 10개 모델 중 1위를 기록했으며, 영어-한국어 번역 정확도도 가장 높은 점수를 기록했다.
테크니컬 리포트 연구 부문을 이끈 네이버클라우드 유강민 리더는 “하이퍼클로바X의 다국어 추론, 기계 번역 능력은 특정 문화권에 더 적합한 배경 지식과 함께 다국어 능력까지 보유해 한층 활용도가 높은 소버린 AI의 가능성을 보여주고 있다”고 설명했다.
하이퍼클로바X는 안전성을 위해 '사회적 이슈와 편향', '불법적 행동' 등 민감한 주제를 설정해 질의 데이터를 수집하고, 이를 기반으로 레드티밍(Red-teaming)을 수행해 모델의 취약점을 보완했다. 또한 하이퍼클로바X 윤리 원칙에 기반해 혐오, 편향, 저작권 침해, 개인정보 등의 콘텐츠는 생성하지 않도록 지속적으로 개선하고 있다.
네이버클라우드는 하이퍼클로바X의 기술력을 바탕으로 글로벌 시장 진출을 본격화할 계획이다. 성낙호 기술 총괄은 “하이퍼클로바X는 한국 특화 지식뿐만 아니라 프로그래밍과 수학적 추론, 다국어 능력과 안전성까지 확보한 소버린 AI의 ‘모범 사례’로서, 해외 시장 진출에도 적극 나설 것”이라고 말했다.
네이버클라우드는 하이퍼클로바X 기술 공개를 통해 국내 AI 기술 경쟁력을 강화하고, 국내 AI 생태계 발전에도 기여할 것으로 기대된다.
Copyright © 이코노믹데일리, 무단전재·재배포 금지