기존 AI 음성 비서나 내비게이션 시스템이 단순 명령 수행에 그쳤다면 이번 기술은 정교한 입 모양과 표정을 구현해 마치 실제 사람과 대화하는 듯한 경험을 제공한다.
연구진은 특히 입술과 턱 등 발화와 직접 관련된 얼굴 부위를 선별적으로 학습, 합성하는 독자적인 방식을 적용했다. 이를 통해 불필요한 데이터 학습을 줄이면서도 입 모양의 미세한 변화, 치아 노출, 피부 주름 등 세밀한 얼굴 표현을 정교하게 구현하는 데 성공했다.
ETRI 측은 해당 기술이 세계적인 학술대회(CVPR, AAAI 등)에 발표된 기존 기술들보다 선명도, 자연스러움, 입술 움직임 동기화 측면에서 우수한 성능을 보인다고 설명했다.
이 기술은 향후 자율주행차 내 AI 운전기사가 운전자와 자연스럽게 소통하거나 키오스크, 은행 창구, 뉴스 진행자, 광고 모델 등 다양한 산업 분야에서 활용될 전망이다. 단순 정보 전달을 넘어 감성적 교감까지 가능한 디지털 휴먼 산업의 핵심 기술로 자리 잡을 것으로 기대된다.
윤대섭 ETRI 모빌리티UX연구실장은 "디지털 기술이 발전할수록 노인과 사회적 약자 등 디지털 소외계층은 늘어나는 추세"라며 "이번 기술이 디지털 접근성을 높이고 스마트 서비스 활성화에 기여하겠다"고 말했다.
연구진은 앞으로 AI 아바타가 실제 사람처럼 자연스럽게 대화하고 움직일 수 있도록 기술을 더욱 고도화하고 다양한 산업 분야 상용화를 위한 기술이전도 적극 추진할 계획이다.
Copyright © 이코노믹데일리, 무단전재·재배포 금지