구글은 17일(현지 시간) 생성형 AI ‘제미나이 2.5 플래시’를 일반 및 클라우드 사용자 대상 미리보기 버전으로 출시했다. 이번 모델은 지난 구글 클라우드 넥스트 2025에서 공개된 경량화된 AI로 일반형과 추론형 두 가지로 제공된다. 추론 기능을 활성화할 경우 기존 딥시크 R1 모델을 능가하는 성능을 보인다.
가격 정책은 더욱 공격적이다. 구글은 이날 API 요금도 함께 발표했다. 100만 토큰 기준 입력 요금은 0.15달러, 출력 요금은 비추론의 경우 0.6달러, 추론 시 3.5달러다. 오픈AI가 전날 공개한 o4 미니의 입력 1.1달러, 출력 4.4달러보다 현저히 낮은 수준이다. 특히 입력 가격만 놓고 보면 딥시크 R1 대비 27%에 불과하다.
구글은 “2.5 플래시는 속도와 비용에 중점을 두면서도 추론 기능을 대폭 업그레이드해 비용 대비 성능이 매우 뛰어나다”며 “품질과 비용, 시간 지연 간 균형 최적화를 위해 ‘사고(추론)’에 대한 예산을 설정할 수 있다”고 설명했다.
오픈AI도 반격에 나섰다. 구글 발표 당일, 고객사들을 대상으로 ‘플렉스 요금제’ 시범 도입 소식을 알렸다. 이 요금제는 응답 시간이 느리고 자원 사용이 간헐적이지만 API 사용료가 절반으로 줄어든다. 이 방식을 택하면 o4 미니는 출력 기준에서 구글 제미나이 2.5 플래시보다 가격 경쟁력을 확보할 수 있다.
그러나 전문가들은 구조적 한계를 지적한다. 테크 업계에서는 자체 클라우드 인프라가 없는 오픈AI의 비용 구조가 약점으로 작용하고 있다는 분석이 지배적이다. 구글은 자사 클라우드와 연계해 수익성을 확보할 수 있는 반면 오픈AI는 마이크로소프트(MS) 등 외부 클라우드에 의존해야 해 가격 인하에 한계가 있다.
여기에 챗GPT 이미지 생성 기능이 폭발적인 인기를 끌며 연산 자원 수요가 급증한 것도 오픈AI에 부담으로 작용하고 있다. 업계 관계자는 “무턱대고 가격 인하 경쟁을 따라가기에는 비용이 부담되기에 연산 속도를 포기한 셈”이라며 “스타트업 역사상 가장 큰 투자를 받았음에도 기존 빅테크의 체력을 단기간에 따라잡기는 어렵다”고 말했다.
한편 구글은 이와 함께 제미나이의 대중화를 위한 전략도 강화하고 있다. 18일에는 K-팝 그룹 르세라핌과 협업한 글로벌 캠페인 영상을 공개했다. 르세라핌 멤버들이 안드로이드 스마트폰과 제미나이를 활용하는 모습을 보여주며 사용자 일상 속 AI 기술 접점을 넓히는 데 초점을 맞췄다. 구글은 “제미나이 라이브의 비주얼 인식 기능이나 실시간 번역 기능 등 실제 사용 사례를 전 세계 이용자에게 소개하고 있다”고 밝혔다.
생성형 AI 시장이 기술 경쟁을 넘어 가격과 소비자 접점까지 확대되면서 빅테크 간 전략 차별화가 본격화되고 있다. 한정된 연산 자원과 투자 회수라는 현실 속에서 각 기업이 어떤 선택을 할지 주목된다.
Copyright © 이코노믹데일리, 무단전재·재배포 금지