[이코노믹데일리] 카카오(대표 정신아)가 글로벌 AI(인공지능) 격전지에서 '평가 기준'을 제시하며 기술 주도권 확보에 나섰다. 단순 문답형 AI를 넘어 스스로 계획하고 행동하는 '에이전틱(Agentic) AI' 시대로의 전환이 가속화되는 가운데, 카카오가 자체 개발한 평가 모델이 세계적 권위의 학회에서 인정받으며 기술력을 입증했다.
카카오는 자체 개발한 '오케스트레이션 벤치마크' 논문이 세계 3대 AI 학회 중 하나인 'ICLR 2026'에 채택됐다고 3일 밝혔다.
ICLR(국제표현학습학회)은 매년 최신 AI 기술 트렌드를 선도하는 논문들이 발표되는 무대다. 올해는 약 1만9000여건의 논문이 제출돼 상위 28%만이 채택될 정도로 경쟁이 치열했다. 구글, 메타, 오픈AI 등 글로벌 빅테크들이 각축을 벌이는 이곳에서 카카오가 성과를 낸 것은 한국형 AI 기술이 글로벌 표준에 근접했다는 의미로 해석된다.
이번 연구의 핵심은 '오케스트레이션(Orchestration)'이다. 이는 AI가 사용자의 복잡한 명령을 수행하기 위해 여행, 쇼핑, 금융 등 다양한 외부 도구(API)를 적재적소에 호출하고 실행 순서를 조율하는 능력을 말한다.
2026년 현재 AI 트렌드는 단순히 텍스트를 생성하는 LLM(거대언어모델)에서 실질적인 업무를 수행하는 '에이전틱 AI'로 급격히 이동하고 있다. 기존 벤치마크(성능 평가 지표)는 단편적인 언어 능력 평가에 그쳐 복합적인 문제를 해결하는 에이전트의 실력을 검증하는 데 한계가 있었다.
카카오가 개발한 벤치마크는 실제 서비스 환경을 그대로 모사했다. 17개 서비스 도메인과 100여개의 가상 도구를 활용해 AI가 얼마나 정교하게 계획(Planning)을 수립하고 도구를 실행(Tool Execution)하는지를 분리해 평가한다. 이는 AI 모델이 단순히 말을 잘하는 것을 넘어 실제 비서처럼 일을 얼마나 잘 처리하는지를 측정하는 '실전 테스트'인 셈이다.
◆ '한국형 AI' 방어기제 구축…오픈소스로 생태계 확장
주목할 점은 이번 벤치마크가 한국어의 문화적 맥락과 특성을 완벽하게 반영했다는 것이다. 글로벌 빅테크의 모델들이 영어권 데이터에 편중된 반면 카카오는 한국어 환경에서의 미묘한 뉘앙스와 서비스 연결성을 평가 지표에 녹여냈다.
이는 향후 AI 서비스 경쟁에서 '언어 장벽'을 넘어 '문화 장벽'을 구축하겠다는 전략으로 풀이된다. 국내 사용자가 "이번 주말 부산 여행 일정 짜줘"라고 말했을 때, 단순히 정보만 나열하는 것이 아니라 KTX 예매 앱과 맛집 예약 앱을 연동해 실질적인 행동까지 연결하는 능력에서 우위를 점하겠다는 포석이다.
카카오는 이 논문과 데이터를 깃허브(GitHub)에 오픈소스로 공개했다. 폐쇄적인 기술 독점 대신 생태계 확장을 택한 것이다. 이를 통해 외부 개발자들이 카카오의 기준에 맞춰 AI 서비스를 개발하도록 유도하고 자연스럽게 카카오 중심의 AI 생태계를 조성하겠다는 자신감이 엿보인다.
이번 연구 성과는 카카오의 차세대 AI 서비스인 '카나나(Kanana)' 등의 고도화로 직결될 전망이다. 카카오는 채팅방 내에서 사용자 의도를 파악해 쇼핑, 결제, 예약 등을 원스톱으로 처리하는 'AI 슈퍼앱' 전략을 추진 중이다.
검증된 오케스트레이션 능력은 카카오톡이라는 강력한 플랫폼과 결합해 시너지를 낼 것으로 보인다. AI가 수많은 채팅방의 맥락을 이해하고 적절한 시점에 필요한 기능을 제안하거나 수행하는 능력이 획기적으로 향상될 수 있기 때문이다.
카카오 관계자는 "에이전틱 AI가 실제 서비스 환경에서 얼마나 안정적으로 작동하는지를 평가하는 핵심 도구를 확보했다"며 "앞으로도 에이전트 간 협업 능력 등을 강화해 카카오만의 차별화된 AI 기술력을 보여줄 것"이라고 밝혔다.
단순한 기술 과시를 넘어 '돈 버는 AI'로의 전환을 꾀하는 카카오가 이번 연구 성과를 바탕으로 실적 반등과 플랫폼 혁신이라는 두 마리 토끼를 잡을 수 있을지 업계의 관심이 집중된다.
Copyright © 이코노믹데일리, 무단전재·재배포 금지










