지난 6개월 간 韓-英 간 번역 이용자 수 모바일에서 75% 증가
구글 "날짜, 인명 등 번역오류 해결 노력"…새 번역시스템 '제로샷' 내놔
[샌프란시스코(미국)= 아시아경제 한진주 기자] 구글 번역 서비스가 개선된 이후 한국 사용자가 크게 늘어난 것으로 나타났다. 구글은 인명과 브랜드명, 숫자 등의 오류를 개선하는데 집중, 사용편의를 개선한다는 계획이다.
16일(현지시간) 미국 샌프란시스코 마운틴뷰 구글 본사에서 마이크 슈스터 구글 브레인팀 리서치 사이언티스트는 "지난 6개월 간 안드로이드에서 한국어-영어 번역 서비스 사용자가 75% 증가했다"며 "특히 신경망 번역을 적용한 후 한국어 서비스 만족도가 중국어보다 더 향상됐다"고 밝혔다.
구글은 지난해 9월 '구글 신경망 기계번역(GNMT)'을 선보인 이후 11월에는 한국어를 포함한 8개 언어에 적용했다. 현재 16개 언어에 적용돼 있다. 번역 품질이 개선되면서 아시아권에서 구글 번역을 활용하는 빈도가 예전보다 크게 늘어났다는 설명이다.
마이크 슈스터 사이언티스트는 "예전 시스템과 비교해 점수를 매겨보면 과거 0.1점 수준이던 것이 최근 중국어, 한국어, 일본어가 0.6~1.5점 정도를 받을 정도로 개선됐다"며 "사람과 신경망 번역 결과물이 받은 점수에 차이가 크지 않다"고 말했다. 예를들어 예전 번역기는 문장이 길 경우 부자연스럽거나 이해하기 어려운 해석, 뉘앙스를 전달하기 어려운 결과물을 내놨는데, 지금은 상당히 개선됐다는 것이다.
이어 "번역속도도 문장당 10초에서 0.2초로 줄였는데 번역 알고리즘과 하드웨어를 개선하면서 더 신속하게 번역을 구현할 수 있게 됐다"고 덧붙였다. 그는 "하나의 언어를 트레이닝 시키는데 2~3주 가량 소요된다"며 "언어 모델별로 1억개 이상의 데이터를 가지고 있다"고도 했다.
구글 번역 서비스는 세계적인 툴이 돼가고 있다는 얘기도 꺼냈다. 월 이용자는 평균 5억명 이상인데, 하루에 1400억개 이상의 단어를 100개 이상의 언어로 번역하고 있다는 집계결과를 내놨다. 또 전체 트래픽 중 92%가 미국 이외에서 발생하고 있다.
구글은 단일 시스템 내에서 여러 언어로 번역할 수 있는 '제로샷 번역'을 최초로 선보였다. 제로샷 번역이란, 다중 언어 트레이닝을 통해 실제 테스트하지 않은 여러 언어 간 번역도 가능하게 하는 기능을 말한다. 예를 들어 영어↔한국어, 영어↔ 일본어 간의 GNMT 번역 지식을 활용해 한국어↔ 일본어 번역을 가능하게 하는 것이다.
구글 번역 서비스가 개선됐지만 여전히 번역 정확도 측면에서 해결해야 할 문제점은 남아있다. 숫자나 날짜, 인명 등에 대한 해석 문제가 꾸준히 거론되고 있다.
슈스터 사이언티스트는 "구글 번역이 완벽하지 않다는 부분에 대해 모두가 동의할 것"이라며 "특히 숫자나 날짜, 짧고 희귀한 쿼리, 이름이나 브랜드에 대한 번역을 향상시켜야 한다"고 말했다. "전문적인 번역보다 일상적으로 이용하는 평균적인 수준에서도 만족할 수 있도록 더 향상시켜야 한다"는 견해도 밝혔다.
실제로 대선 기간에 나온 외신 기사들을 번역해보면 '문재인' 대통령을 지칭하는 'Mr.Moon'을 '문선명'으로 번역하는 사례가 등장하기도 했다.
이에 대해 그는 "이용자들의 제안을 받아서 고치는 것도 가능하지만 장기적으로는 신경망 모델이 이 문제를 스스로 개선해야 한다"며 "관련 영문기사 등 많은 데이터를 활용해 학습시켜야 한다"고 설명했다.
현재의 번역 방식은 '문장'을 단위로 해석한다. 같은 번역문이라도 이전 문단에서 해석한 정보가, 다음 문단으로 넘어가면 이전되지 않는다. 구글은 이같은 부분도 개선할 계획이다.
마이크 슈스터 사이언티스트는 "문장을 벗어난 다음에도 번역 정보를 이전해줘야하는데 아직은 불가능한 상황이며 시간이 오래 걸리더라도 정보를 이전해 줄 수 있도록 개선할 예정"이라고 말했다.
한진주 기자 truepearl@asiae.co.kr
<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>