IT

수퍼톤, AI 음성 기술 API 공개… 서비스 확장 박차

선재관 기자 2024-12-24 10:11:31
TTS API 공개, AI 음성 기술 활용 저변 확대
수퍼톤 API 키 이미지
[이코노믹데일리] AI 오디오 기업 수퍼톤이 AI 음성 기술을 외부 서비스에 연동할 수 있도록 ‘수퍼톤 API’를 공개하며 서비스 확장에 나섰다. 지난 23일부터 클로즈드 베타 테스트(CBT)를 진행 중인 ‘수퍼톤 API’는 다양한 플랫폼에서 수퍼톤의 AI 음성 기술 활용을 지원한다.

API(응용 프로그래밍 인터페이스)는 서로 다른 소프트웨어 간 데이터 교환 및 기능 공유를 가능하게 하는 연결고리다. 수퍼톤은 자체 개발한 TTS(Text-to-Speech) 기술을 API 형태로 우선 제공한다. 특히 자체 개발 모델 ‘낸시(NANSY)’를 통해 자연스러운 음색과 감정 표현이 가능한 음성을 생성하는 것이 특징이다. 

‘낸시’는 목소리를 음색, 발음, 음높이, 강세 등 네 가지 요소로 분석하여 실제 사람 목소리와 유사한 음성을 만들어낸다. 또한 기존 모델을 개선하여 음성 변환 속도를 향상시켜 챗봇 등 즉각적인 피드백이 필요한 서비스 개발에 유용하다. TTS API는 게임, 오디오북, 애니메이션, 채팅 서비스 등 다양한 분야에서 활용될 수 있다.

수퍼톤은 이미 스캐터랩의 인터랙티브 AI 콘텐츠 플랫폼 ‘제타(zeta)’와의 협업을 통해 TTS 기술을 API 형태로 제공하며 기술력을 입증한 바 있다. 향후에는 TTS 기술뿐만 아니라 가창 합성 음성 기술 및 음성 변환 기술까지 API 제공 범위를 확대할 계획이다.

이교구 수퍼톤 대표는 “수퍼톤 API는 수퍼톤의 AI 음성 기술 활용도를 넓히고 상용화하는 중요한 계기가 될 것”이라며 “비즈니스 파트너뿐 아니라 1인 또는 소규모 콘텐츠 크리에이터들도 수퍼톤의 AI 음성 기술을 활용하여 더욱 자연스럽고 몰입감 있는 인터랙티브 콘텐츠 등을 제작할 수 있을 것”이라고 강조했다.