IT

네이버가 만드는 초거대 AI세상 '하이버클로바X' 드디어 개봉한다

선재관 2023-08-24 04:00:00
24일 10시 그랜드 인터컨티넨탈 서울 파르나스에서 '팀 네이버 컨퍼런스 단(DAN) 23' 개최 하이퍼클로바X는 2021년 선보인 AI 모델의 업그레이드 버전 챗 GPT보다 한국어 습득 능력이 6500배 뛰어난 초대규모 AI서비스
[사진=네이버]

[이코노믹데일리] 네이버는 24일 10시 그랜드 인터컨티넨탈 서울 파르나스에서 ‘팀 네이버 컨퍼런스 단(DAN) 23’을 개최한다.

네이버가 공개할 한국어에 특화된 거대언어모델(LLM) 인공지능(AI) 하이퍼클로바X는 2021년 선보인 AI 모델의 업그레이드 버전이다. '챗 GPT' 보다 한국어 습득 능력이 6500배 뛰어난 초대규모 AI서비스로 알려졌다. 

이번 컨퍼런스에서 하이퍼클로바X의 소개와 이를 기반으로 한 대화형 에이전트 클로바X, 검색 서비스 큐(Cue:) 등 소비자 대상(B2C) AI 서비스를 대거 선보일 예정이다.

네이버가 2년 전 공개한 기존 클로바의 매개변수 규모는 오픈AI의 GPT-3(1750억 개)보다 많은 2040억개였다. 이번에 공개되는 하이퍼클로바X의 매개변수 규모는 이 보다 많을 것으로 예상된다. 정확한 수치는 공개되지 않았다. 하지만 네이버는 “하이퍼클로바X는 챗 GPT보다 한국어를 6500배(GPT 3.5 기준) 많이 학습했다”고 강조한다.
 
최수연 네이버 대표이사 [사진=네이버]

최수연 네이버 대표는 지난 21일 'AI 시대 속 네이버의 경쟁력'이란 제목의 주주 서한에서 "네이버는 500명이 넘는 대한민국의 가장 뛰어난 AI 엔지니어들과 전문가들로 팀을 꾸리고, 매개변수(파라미터)가 1천억개 이상인 대규모 언어 모델(LLM)을 자체 개발한 전 세계 다섯 개 기업 중 하나"라면서 "최근 3∼4년간 AI에 대한 네이버의 누적 투자 규모는 약 1조원에 달하며 기초 연구부터 애플리케이션(앱) 개발·연동에 이르기까지 광범위한 투자가 이뤄지고 있다"고 밝혔다. 

이어 "네이버는 생성형 AI가 우리의 핵심 역량을 더욱 확장하고 강화하는 중요한 기회라고 확신하고 있다"며 "기반 기술·검색 고도화, 핵심 앱의 경쟁력 강화, 비즈니스·창작 생산성 극대화, 맞춤형 AI 솔루션 제공, 생성형 AI 기반의 새 플랫폼 제공 목표에 집중하겠다"고 강조했다.

최 대표는 "네이버는 그 어느 경쟁 플랫폼도 보유하지 못한 고품질의 광범위한 개인화 데이터를 보유하고 있다"며 "이는 네이버의 AI 경쟁력을 더욱 공고히 해줄 것"이라고 주장했다.

그 근거로 국내 검색어 점유율 1위, 국내 가장 널리 사용되는 지도 서비스, 240만개의 오프라인 상점·식당에 대한 로컬 리뷰, 차별화한 콘텐츠 소비(뉴스, 지식iN, 네이버 블로그, 네이버 카페 등), 국내 대표 여행 예약 사이트, 15억개 이상의 상품과 11억개의 리뷰를 보유한 이커머스(전자상거래), 월 1억건 이상의 결제 처리 건수를 들었다.

최 대표는 "네이버는 AI라는 새로운 변화를 맞이할 준비를 완료했다"며 "AI는 기존 네이버의 경쟁 우위를 더욱 확고히 할 수 있을 것"이라고 거듭 강조했다.
 
하이퍼클로바X에 대해 설명하는 김유원 네이버클라우드 대표[사진=네이버클라우드]

하이퍼클로바X의 최대 장점은 한국어에 최적화된 서비스라는 점이다. 한국어 중심의 초거대AI는 한국어에 최적화된 ‘토큰(token)’을 배정하게 돼 있다. 토큰은 네이버가 인공지능 학습용으로 사용한 ‘우리말 빅데이터(말뭉치)’로 지난 20여년간 네이버가 국내 1위 포털로 축적한 언론사 뉴스와 각종 블로그, 네이버카페 등에서 생성된 모든 콘텐츠 등을 활용 할 수 있다. 

이러한 문장을 분석하고 간소화하여 큰 범위의 빅데이터를 구축하고 나면 그만큼 짧은 연산과정을 거쳐 답변을 내놓기 때문에 서비스 비용이 영어 기반 거대언어모델(LLM) 대비 낮다. 다만 여기에 사용되는 특히 언론사 뉴스 말뭉치 등에 대한 저작권 분쟁 등에 얼마만큼 자유로울 수 있는지 의문이다.

물론 단점도 존재한다. 성낙호 네이버클라우드 하이퍼스케일 AI 기술총괄은 한 외신과의 인터뷰에서 “기술적 관점에서 네이버의 기술은 오픈AI의 챗GPT 대비 8개월 가량 뒤쳐져 있다”며 기술격차를 인정한 바 있다. 인터뷰 후 석달 가량이 지났으니 네이버가 오픈AI와의 기술 격차를 얼마나 좁혔는지 이날 발표에 기대가 된다.

규모와 자금력 측면에서도 네이버의 올 상반기 별도 기준 현금 및 현금성 자산은 5848억원으로 2021년 말의 9644억원 대비 크게 줄었다. 네이버가 포쉬마크를 필두로 중고거래 및 웹툰 기업 인수·합병에 힘을 쏟으며 자금 동원력이 크게 줄어든 탓이다. 네이버는 최근 판교테크원타워(알파돔시티 6-2블록) 보유 지분 45.08%를 싱가포르투자청(GIC)에 3500억원에 매각하는 등 자금 확보를 하기도 했다. 이러한 상황에 하이퍼클로바X 공개 후 적절한 수익모델을 찾지 못하면 오히려 이용자 급증은 부담이 될 수 있다.

하드웨어 인프라 구축 면에서도 불리하다. LLM 인프라 구축에는 빅데이터 학습에 최적화된 엔비디아의 그래픽처리장치(GPU)가 반드시 탑재돼야 하는데 LLM 기반의 답변을 내놓은 추론형 칩에는 엔비디아 제품 외에도 리벨리온, 사피온, 퓨리오사AI 등 한국 기업의 AI 전용 칩을 사용해도 되지만 제일 중요한 학습용 칩은 엔비디아의 GPU 외에는 대안이 없기 때문이다. 이 때문에 엔비디아 GPU ‘H100’ 가격이 하나에 6000만원에 육박하기에 부담이 될 수 밖에 없다.

현재 엔디비아 GPU 칩은 발주를 하더라도 석달 뒤에나 납품 받을 정도로 시장에 씨가 마른 상황이다. 네이버는 삼성전자와 손잡고 이 같은 약점을 극복한다는 방침이지만 학습용 AI칩 수급 불안은 근심거리가 될 전망이다.

한편 네이버는 하반기 네이버앱 개편을 진행할 계획이다. 앱 개편을 통해 소비자의 관심사를 파악하고 개인화된 추천으로 콘텐츠를 소비할 수 있도록 할 예정이다. 나아가 관심사를 통해 쇼핑이나 버티컬 서비스로 이어질 수 있는 서비스도 제공할 방침이다.