구글 번역 고유명사 오류…문재인 후보 기사의 '문'을 '문선명'으로
홍준표 후보 지칭하는 '홍'을 '홍콩'으로 번역하기도
구글 "번역 오류 발생 이유, 설명하기 어렵다"
[아시아경제 한진주 기자] 구글 번역이 문재인 더불어민주당 후보를 고 문선명 통일교 총재로 번역하는 것으로 나타났다.
영문으로 문재인 후보를 지칭하는 'Moon'이나 'Mr. Moon'이라는 표현에 대해 구글 번역에서는 '문선명'으로 해석했다.
예를 들어, '더불어민주당 문재인 후보의 지지율이 31%에서 38%로 올라갔다'(Moon, of the Democratic Party of Korea, garnered 38 percent support, up from 31 percent.)는 문장이 있다. 이 문장을 구글에서 번역하면 '문선명(38 %)은 31%에서 38%로 상승했다'는 결과가 나온다.
문재인 후보의 실명을 그대로 쓴 경우는 바르게 번역했지만, 문 씨 혹은 문 후보라고 축약한 경우 대부분 '문선명'으로 번역됐다. 국내에서는 야권의 유력한 대선 후보로 인지도가 높지만 해외에서는 고 문선명 통일교 총재를 검색하는 빈도가 더 높았기 때문이다.
대선 후보에 대한 외신 기사를 번역했을 때 홍준표 후보를 일컫는 'Hong'을 '홍콩'으로 번역하는 경우도 있었다. CNN 기사 중 '"거짓말이라면 트럼프의 임기 중에 한국은 트럼프가 말하는 것을 신뢰하지 않을 것"이라고 (중략) 홍콩이 말했다.'라고 해석하기도 했다. 이 문장에서는 인물을 지칭한 고유명사를 홍콩이라는 지명과 구분해내지 못했다.
익명을 요구한 통·번역업체 연구원은 "실제로 문선명 총재를 찾기 위해 'moon'을 검색한 사람이 많았기 때문에 번역 결과에서도 그렇게 나온 것으로 보인다"며 "'문재인'으로 해석하려면 구글의 기술 담당자가 'Moon'을 문재인과 매칭할 수 있도록 훈련을 시켜야 한다"고 말했다.
이어 "인공신경망 번역의 경우 앞 뒤 문단을 다 이해하는 것이 아니고 문장 단위로만 흐름을 이해한다"며 "문장에 포함된 '문'이라는 단어를 사람이라는 것은 알아챘더라도 단락의 흐름까지 이해하는 수준은 아니다"라고 설명했다.
구글은 지난해 11월부터 한국어에 '구글 신경망 기계번역(Google Neural Machine Translation, GNMT)'을 적용했다. 전체 문장을 하나의 번역 단위로 간주해서 번역하는 기술이다. 구글 측은 뉴스 매체 샘플 문장으로 테스트 했을 때 번역 오류가 55%에서 85% 수준으로 감소했다고 밝힌 바 있다. 아직까지 인물을 지칭하는 고유명사나 직함 등에 대해서는 오류가 많아 훈련이 필요하다는 지적도 나온다.
구글 코리아 관계자는 "구글 번역의 오류를 줄이고자 다양하게 노력하고 있지만 때로는 오류가 발생하기도 하고, 여러가지 이유가 있을 수 있으므로 특정 번역 오류가 발생하는 이유에 대해서는 설명하기 어렵다"고 밝혔다.
한진주 기자 truepearl@asiae.co.kr
<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>