세계 최고 권위 그래픽 기술 분야 컨퍼런스서 신규 AI 기술 공개
음성 입력 시 AI가 감정 및 표정 자동 분류, 캐릭터 안면에 적용
"생동감 있는 그래픽 효과 연출 자동화 목표"
넷마블은 지난 14일부터 17일까지 일본 도쿄(Tokyo) 및 온라인에서 동시 개최된 시그라프 아시아 2021(SIGGRAPH Asia 2021)에서 음성 대사 감정을 자동 인식해 이를 기반으로 안면 애니메이션을 생성하는 기술을 공개했다고 20일 밝혔다.
시그라프 아시아는 세계 최고 권위의 그래픽 기술 분야 컨퍼런스로, 게임 및 그래픽 디자인, 컴퓨터 애니메이션 및 상호작용 기술, 시각 효과 등에 관한 다양한 연구 주제를 다룬다.
넷마블이 이번 컨퍼런스에서 공개한 기술의 핵심은 시스템 상에 음성 데이터를 입력하면 AI가 자동으로 음성 대사에서 감정을 분석 및 추출하고, 해당 감정에 맞는 자연스러운 얼굴 표정과 립싱크 애니메이션을 게임 캐릭터에 적용하는 것이다. 궁극적으로는 현실적이고 생동감 있는 3D 그래픽 효과 연출을 자동화하는 것을 목표로 하고 있다.
논문 발표를 진행한 넷마블 AI센터 안수남 팀장은 “넷마블이 자체 개발한 본 기술은 음성 감정 인식, 얼굴 표정, 립싱크 등 세 가지 모듈을 종합해 실제 사람 표정 같은 자연스러운 그래픽을 구현할 수 있는 모델”이라며, “기쁨과 슬픔, 두려움 등 여러 감정 표현에 관한 일정한 기준을 만들고, 여기에 각각 다른 강도를 부여하여 풍부한 감정 표현을 자동으로 생성하는 것이 핵심이다”라고 설명했다.
넷마블 AI센터 오인수 실장은 “이 기술을 적용함으로써 게임 이용자의 몰입도 향상뿐만 아니라 개발 기간 단축 등 여러 부가적인 순기능도 기대하고 있다”며, “다양한 언어 기반 음성 처리를 할 수 있는 만큼, 향후 글로벌 신작 개발에도 적극 적용할 수 있도록 기술을 고도화해 나가겠다”고 말했다.