IT

내 목소리가 캐릭터 음성으로 바뀐다...AI 음성 변환 '수퍼톤 시프트' 오픈 베타 출시

선재관 2024-04-15 15:47:31
자연스러운 음성, 실시간 변환, 10초 커스텀까지…놀라운 기술력 자랑 콘텐츠 제작의 다양성과 완성도를 한 단계 업그레이드
실시간 목소리 변환 AI 솔루션 ‘수퍼톤 시프트’

[이코노믹데일리] 인공지능(AI) 기술로 개인의 목소리를 원하는 캐릭터 목소리로 실시간 변환해주는 서비스가 등장했다. 하이브 자회사인 AI 오디오 기업 수퍼톤은 15일, 게임, 영화, 애니메이션 등 다양한 콘텐츠 제작에 활용 가능한 AI 기반 실시간 음성 변환 서비스 '수퍼톤 시프트'(이하 시프트)의 글로벌 오픈 베타를 시작했다고 밝혔다.

콘텐츠 제작자의 창작을 지원하고 업무 편의성을 높이기 위해 개발된 시프트는 사용자가 10개의 캐릭터 음성 중 원하는 목소리를 선택하면, 사용자가 발화하는 즉시 선택한 캐릭터 목소리로 실시간으로 변환해주는 서비스다.

수퍼톤은  지난해 11월 부산 벡스코에서 열린 국제 게임 전시회 ‘지스타2023’의 B2B 부스에 참가해 시프트를 처음 선보이며 국내외 주요 미디어의 관심을 끌었다.

시프트는 △자연스러운 음성 발화 스타일 △실시간 수준으로 음성변환 속도 단축 △ 단 10초 만에 사용자 목소리를 캐릭터로 커스텀하는 기능 등 3가지 핵심 기능을 통해 차별화된 경쟁력을 갖추고 있다.

시프트는 실제 사람의 발화에 가깝게 자연스럽고 섬세한 음성을 구현하는 것이 특징이다. 수퍼톤 자체 개발한 음성 합성 파운데이션 모델 낸시(NANSY)를 기반으로 사용자의 목소리를 음색, 발음, 음고, 강세 등 4가지 구성 요소로 빠르게 분석하여 사용자와 캐릭터 목소리를 실시간 변환한다. 이를 통해 기계적인 느낌 없이 실제 사람의 목소리와 가까운 자연스럽고 섬세한 음성을 구현한다.

또 음성이 출력돼 청자에게 도달하는 지연 시간을 47ms(밀리 세컨드)까지 단축시켜 끊김 없이 자연스럽게 소통할 수 있도록 한다. 이는 세계적으로도 뛰어난 수준이다.

사용자 편의성도 대폭 높였다. 사용자가 10초 가량의 샘플 대본을 읽는면 바로 사용자가 선택한 캐릭터 목소리로 음성 변환이 시작된다. 또한, 사용자는 자신의 취향이나 목적에 맞게 음성을 자유롭게 생성할 수 있도록 사용자와 캐릭터 음성 간의 혼합 비율, 감정 표현 정도, 음의 높낮이 등을 섬세하게 조절할 수 있는 기술 도구를 제공한다.

이처럼 시프트는 콘텐츠 제작자들에게 다양한 활용 가능성을 제시한다. 버튜버나 스트리머, 팟캐스터들은 개성 있는 목소리로 시청자들에게 색다른 경험을 제공하고, 게이머와 코스튬 플레이어들은 게임 캐릭터 목소리로 타 유저들과 음성 채팅을 즐기며 게임 몰입감을 높일 수 있다.

이교구 수퍼톤 대표는 "시프트는 제작사와 크리에이터들이 손쉽게 사용할 수 있도록 다양한 의견을 수집하는 것이 이번 오픈 베타의 가장 큰 목적"이라며 "정식 출시 버전에는 목소리 샘플을 확대하고 콘텐츠 제작에 유용한 기능들을 추가 탑재하는 등 시프트가 최적의 목소리 창작 도구로 널리 사용될 수 있도록 노력하겠다"고 말했다.