엔씨 음성합성 기술, 국제학회 논문 발표

실제 음성과 구분 어려운 완벽한 음질 자랑

[아시아경제 이진규 기자] 엔씨소프트(이하 엔씨)는 자사가 개발한 음성합성 기술 'VocGAN'이 10월 '인터스피치 2020'을 통해 정식 발표된다고 23일 밝혔다.

인터스피치는 음성인식·합성 분야에서 세계 최고의 권위 있는 국제학회로 알려졌다.

VocGAN은 엔씨 인공지능(AI) 센터 산하의 'Speech AI Lab' 음성합성팀에서 자체 개발한 뉴럴 보코더(Neural Vocoder) 기술이다. 녹음 음성과 실제 음성의 구분이 어려운 수준의 완벽한 음질, 빠른 속도와 가벼운 무게가 특징이다.

엔씨는 음성합성 기술을 다양한 영역에 활용하고 있다. '블레이드앤소울' 프론티어 월드 튜토리얼 영상 '안내서'의 내레이션은 모두 합성음으로 제작했다. 성우가 직접 대사를 익히고 녹음하고, 검수하는 과정이 없어지면서 제작 시간이 단축됐다.

게임 개발 과정에도 음성합성 기술이 적용된다. 개발 단계에서 캐릭터의 대사 내용과 분량을 검수하는 등 최적화 테스트 과정에도 사용한다. 엔씨 사내 방송을 통해 AI 합성음으로 한 권의 책을 소개하는 '엔씨 AI 북스'를 운영하기도 했다. 엔씨 관계자는 "음성 데이터 축적부터 딥러닝 모델 학습, 합성음 생성 테스트와 최종 서비스까지의 일련의 과정들을 모두 클라우드에 자동화하고 있다"고 전했다.

이진규 기자 jkme@asiae.co.kr<ⓒ경제를 보는 눈, 세계를 보는 창 아시아경제(www.asiae.co.kr) 무단전재 배포금지>

4차산업부 이진규 기자 jkme@asiae.co.krⓒ 경제를 보는 눈, 세계를 보는 창 아시아경제
무단전재, 복사, 배포 등을 금지합니다.

오늘의 주요 뉴스

헤드라인

많이 본 뉴스