IT

오픈AI, 보고 듣고 말하는 AI 모델 GPT-4o 출시

선재관 기자 2024-05-14 07:34:57
'잠자리 이야기 들려달라' 요청에 목소리, 감정, 톤 바꿔 이야기 스마트폰은 물론 데스크톱 컴퓨터 등에서도 무료로 사용
 
오픈AI가 홈페이지에 공개한 GPT-4o 사용방법. [사진=오픈AI 홈페이지]

[이코노믹데일리] 대화형 인공지능(AI) 챗GPT를 개발한 미국 오픈AI가 13일(현지시간) 보고 듣고 말하는 새로운 AI모델 'GPT-4o(GPT-포오)'를 공개했다.

 GPT-4o는 챗GPT를 움직이는 기반이 되는 기술로 o는 '모든'을 뜻하는 '옴니'의 앞 글자에서 가져왔다. 이번에 공개된 GPT-4o는 종전보다 처리 속도가 2배 빨라졌지만 운용 비용은 절반 수준으로 줄었다. 말을 걸면 사람과 같은 반응 속도로 대화를 나눌 수도 있다. 약점으로 꼽히던 반응 지연도 극복했다. 특히 새로운 AI는 한국어를 비롯해 총 50개국 언어를 지원하며 문자, 이미지, 음성 모두 인식한다. 실시간 번역과 함께 스마트폰 카메라를 이용해 사람의 얼굴 표정이나 그래프도 읽을 수도 있다.

오픈AI는 "GPT-4o라는 AI 시스템을 기반으로 한 새로운 애플리케이션(앱)이 이전 버전의 기술보다 훨씬 빠르게 오디오, 이미지 및 비디오를 저글링한다"고 설명했다.

해당 앱은 이날부터 스마트폰은 물론 데스크톱 컴퓨터 등에서 무료로 사용할 수 있다. 챗GPT를 데스크톱 앱으로 제공하는 건 이번이 처음이다.

오픈AI의 미라 무라티 최고기술책임자(CTO)는 이날 라이브 행사에서 GPT-포오 공개와 함께 시연도 선보였다. 휴대전화로 '내가 좀 긴장한 상태다. 어떻게 진정할 수 있을까'라고 문의하자 '숨을 깊이 들이마시라'는 답이 음성으로 돌아오는가 하면 '잠을 잘 자지 못하는 친구를 위해 잠자리 이야기를 들려달라'는 요청에 AI 모델은 다양한 목소리와 감정, 톤을 바꿔가며 이야기를 들려주기도 했다. 

무라티는 뉴욕타임스와의 인터뷰에서 "우리는 우리 자신과 기계 사이의 상호 작용의 미래를 보고 있다"며 "여러분은 자연스러운 대화를 나눌 수 있는 경험을 원했고 가능해졌다"고 말했다.