본문 바로가기
bar_progress

글자크기 설정

닫기

한·영·불·러·아랍어 등 9개 언어, 말하면 문자로 변환

시계아이콘읽는 시간1분 11초

ETRI, 언어 음성인식기 개발
95% 인식률…향후 20개언어로 확장
"한국어 인식은 구글보다 낫고
다른 외국어는 대등한 수준"


[아시아경제 김동표 기자]국내 연구진이 한국어, 영어 뿐만 아니라 일본어, 중국어 등 9개 언어 음성인식기 개발에 성공했다. 말을 하게 되면 해당 언어로 바로 문자 변환이 가능하게 됐다.

한·영·불·러·아랍어 등 9개 언어, 말하면 문자로 변환
AD



ETRI(한국전자통신연구원)는 18일 "사람의 음성을 실시간으로 문자로 변환 할 수 있는 기술개발에 성공했다. 사람들의 일상대화에서 언어별로 최대 95% 수준의 인식성능을 보여 상용화가 가능한 수준"이라고 밝혔다. 9개 언어는 한국어, 영어(북미식), 일본어, 중국어(북경 표준어), 프랑스어, 스페인어(유럽식), 독일어, 러시아어, 아랍어(MSA)다.

연구진은 본 기술이 스마트폰을 비롯, 스마트 스피커, 스마트 홈 허브 기능을 가지는 셋톱박스, 냉장고, TV 등의 스마트 가전으로 음성인식 기술이 급격히 확산되고 있는 점을 고려할 때, 글로벌 시장 진출을 계획하는 국내 업체들에게 큰 도움이 될 것으로 내다봤다.


ETRI는 인공지능 기술의 한 분야인 딥러닝기술을 바탕으로, 대용량의 데이터를 이용해 기술이 개발되었다고 설명했다. 아울러 빅데이터와 관련된 대용량 데이터 자동 정제기술, 다국어 발음 생성기술 등 다국어 음성언어처리 핵심기술도 확보해 추후 동남아, 힌디어 등 타 언어로 확대가 쉽다고 밝혔다.


연구진은 본 기술이 구글(Google) 등 세계 업체와 비교시 한국어에서는 성능 우위를 점하고 다른 언어에서는 대등한 수준이라고 말했다.


ETRI는 본 인식기 개발이 일상 대화체의 연속 발화가 가능해 향후 통역은 물론, 인공지능 비서, 방송의 자막화, 콜센터 서비스 등에 활용이 가능할 것으로 보고 있다.


서비스 방식은 기존과 비슷하다. 클라이언트 서버형과 단말 탑재형 등으로 이뤄진다. 연구진은 본 음성인식기가 응용 분야에 따라 한 번에 수명에서 수십명까지 동시 접속해 인식이 가능한 수준이라고 설명했다.


현재 국내에는 ETRI와 같이 다국어 음성 데이터(DB)와 말뭉치로 불리는 음성 텍스트의 다국어 데이터(DB)를 보유한 곳이 없어 이를 기반으로 개발된 다국어 음성인식기를 필요로 하는 기업에 큰 도움이 될 것으로 기대된다.


글로벌 시장을 동시에 공략해야 하는 최근의 음성인식 산업계 흐름을 감안할 때, 본 음성인식 기술을 이용해 인공지능 비서, 자동통역 서비스, 커넥티드 카 등의 주요 다국어 음성인식 관련 세계 시장에 동시 진출할 수 있을 것으로 연구진은 전망했다.


ETRI는 향후 음성인식 기술을 필요로 하는 국내 이동통신업체를 비롯하여 주요 포털, 음성인식엔진 기술을 상용화하고 있는 기업체에 기술 이전할 예정이다.
또한, 본 기술은 일반 콜센터나 보험회사와 같이 상담자의 음성 데이터를 축적하고 분석해야 하는 업체에도 큰 도움이 될 것으로 보고 있다.


ETRI는 현재 본 기술을 내년 평창 동계올림픽 자동 통·번역 서비스 부문 공식 후원사인 한글과컴퓨터와 함께 '지니톡' 자동통역 서비스에 적용해 시범서비스 중이다.


향후 2020년 동경올림픽 개최 시점까지는 대상 언어를 14개 언어로 확대하고, 추가적으로 20개 언어 이상으로 늘려 나갈 예정이다.




김동표 기자 letmein@asiae.co.kr
<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>

AD
AD

당신이 궁금할 이슈 콘텐츠

AD

맞춤콘텐츠

AD

실시간 핫이슈

AD

위로가기