IT

카카오, '카나나' AI 모델 공개…글로벌 AI 시장에서 한국어 우위 강조

선재관 기자 2024-10-23 14:50:23
한국어 처리 성능 세계 최고…멀티모달·비주얼 생성까지 포괄하는 기술 선봬   엔비디아와 협력 통해 AI 기술 가속화 및 글로벌 확장 계획
김병학 카나나알파 성과리더가 23일 ‘이프카카오2024’ 컨퍼런스에서 발언을 하고 있다.[사진=카카오]

[이코노믹데일리] 카카오는 23일 경기도 용인에서 열린 '이프카카오 2024' 행사에서 자사의 새로운 생성형 AI 모델 시리즈인 '카나나(Kanana)'를 공개했다. '카나나'는 카카오가 지금까지 개발한 다양한 인공지능(AI) 기술을 통합한 모델로 특히 한국어 처리 능력에서 글로벌 경쟁 모델을 크게 능가하는 성과를 보였다. 카카오는 이를 통해 국내 시장을 넘어 글로벌 AI 시장에서 경쟁력을 강화할 계획이다.

김병학 카나나알파 성과리더는 이날 발표에서 “카나나 모델은 한국어 처리 능력이 매우 뛰어나 글로벌 AI 시장에서도 중요한 경쟁력을 확보할 수 있을 것”이라고 말했다. 특히 그는 "카나나 모델은 GPT-4.0, 라마 3.1 등 세계적인 AI 모델과 비교해도 경쟁력을 갖추고 있으며 한국어 성능에서는 압도적인 성능을 보이고 있다"고 강조했다.

카카오는 이번 발표에서 ‘카나나’ 브랜드를 중심으로 다양한 AI 기술을 하나의 통합 플랫폼으로 제공할 것이라고 밝혔다. 이 통합 모델은 언어모델, 비주얼 생성모델, 음성모델, 멀티모달 언어모델 등 다양한 기능을 포괄하며 이를 통해 사용자들에게 보다 일관되고 고도화된 AI 경험을 제공할 계획이다.

◆ 카나나 모델 라인업, 언어모델부터 비디오 생성까지  

카카오는 '카나나' 모델을 통해 다양한 목적에 맞는 AI 서비스를 제공할 예정이다. 이번에 공개된 카나나 시리즈는 크게 언어모델, 멀티모달 언어모델, 비주얼 생성모델, 음성모델 등으로 구분된다.

 
[사진=카카오]

언어모델은 처리 용량에 따라 △카나나 나노(초경량 언어모델) △카나나 에센스(중소형 언어모델) △카나나 플래그(고성능 초거대 언어모델)로 세분화된다. 이를 통해 각기 다른 서비스 환경에 맞춘 맞춤형 AI 서비스를 제공할 수 있으며 서비스 목적에 맞게 성능과 비용 효율성을 최적화할 수 있다.

멀티모달 언어모델은 다양한 데이터를 통합적으로 처리할 수 있는 능력을 갖추고 있다. 이 모델은 △오디오 언어모델(카나나-a) △이미지/비디오 언어모델(카나나-v) △통합 멀티모달 언어모델(카나나-o)로 구성된다. 김병학 성과리더는 "카나나-o 모델은 텍스트뿐만 아니라 이미지, 오디오, 영상 데이터를 통합적으로 처리할 수 있으며 한국어에서는 세계적으로 가장 뛰어난 성능을 보였다"고 말했다.

비주얼 생성 모델인 '키네마'는 사용자가 텍스트 입력이나 이미지를 기반으로 영상 콘텐츠를 제작할 수 있는 AI 기술이다. 특히 카메라 움직임이나 캐릭터의 움직임을 마우스 조작만으로 제어할 수 있어 비디오 콘텐츠 제작 과정이 훨씬 간단해질 전망이다. '콜라주'는 개인화된 이미지 생성을 지원하는 모델로 다양한 콘텐츠 제작에 활용될 수 있다.

음성모델은 음성 인식과 음성 합성 두 가지로 구분된다. 음성 인식 모델인 '카브'와 음성 합성 모델인 '캐스트'는 자연스러운 음성 상호작용을 지원한다. 이 기술을 통해 카카오는 다양한 서비스에서 AI 기반 음성 인식과 합성 기능을 적용할 예정이다.

카나나 모델의 가장 큰 강점은 한국어 처리에서 세계 최고 수준의 성능을 보인다는 점이다. 김병학 성과리더는 "카나나 에센스 모델은 글로벌 성능을 가진 유사한 모델들과 비교했을 때 평균적으로 동등하거나 더 우수한 성능을 보였으며 한국어 성능에서는 특히 월등했다"고 강조했다.

카카오는 자체적으로 구축한 고품질의 한국어 데이터셋을 기반으로 모델을 학습시켜 한국어 처리에 있어 강력한 경쟁력을 확보했다. 또한 저작권과 개인정보 이슈를 해결한 투명한 학습 과정을 거쳐 데이터의 신뢰성 또한 높였다. 이를 바탕으로 카카나는 한국뿐 아니라 글로벌 AI 시장에서도 경쟁력을 갖출 것으로 기대된다.

◆ AI 기술 가속화...엔비디아와의 협력 강화

카카오는 글로벌 반도체 기업 엔비디아와 협력해 AI 기술 개발을 가속화하고 있다. 엔비디아는 카카오의 AI 모델 개발 조직인 '카나나 알파'와 협력하여 AI 모델을 제작하고 있으며 '카나나 엑스'와는 인프라 협업을 진행하고 있다. 엔비디아의 최신 그래픽 처리 장치(GPU)인 GH200은 카나나 모델의 효율적인 추론을 돕고 있다.

타이 맥커처 엔비디아 수석 부사장은 "카카오는 엔비디아와의 협력을 통해 더 빠르고 효율적으로 AI 기술을 도입할 수 있을 것"이라며 "우리는 한국을 넘어 글로벌 AI 생태계를 확장할 계획"이라고 밝혔다. 카카오는 이번 협력을 통해 AI 네이티브 컴퍼니로의 전환을 가속화하고 글로벌 시장에서도 더 큰 경쟁력을 확보해 나갈 것으로 예상된다.

한편 카카오는 '카나나' 모델을 자사의 주요 서비스에 적극적으로 적용할 예정이다. 특히 카카오톡의 AI 대화 요약 기능, 톡채널의 AI 매니저 등 사용자와의 상호작용을 개선하는 서비스에 AI 기술을 적용할 계획이다. 이를 통해 사용자는 더욱 자연스럽고 지능적인 AI 서비스를 경험할 수 있을 것이다.

김병학 리더는 "카나나 모델은 단순히 기술력을 과시하는 데 그치지 않고 실제 사용자 문제를 해결하는 실용적인 서비스를 제공할 것"이라고 밝혔다. 그는 이어서 "카카오는 AI 네이티브 컴퍼니로 전환해 AI를 기반으로 모든 비즈니스 활동을 혁신하고 내외부 생산성을 극대화할 것"이라고 강조했다.