AI 번역기 1등 비결은 'NMT'…인간은 아직 '넘사벽'

네이버, 200자 넘으면 SMT 번역으로 자동 전환SMT 방식으로 답안 제출해 구글에 밀려NMT 방식은 문장 전체 넣어 번역, SMT 방식보다 2배 정확SMT는 구 단위로 번역해 문장 어색

21일 서울 세종대학교에서 열린 '인간 대 기계의 번역대결'에서 출제진이 기계 번역을 시행하기 전에 기념촬영을 하고 있다.

[아시아경제 한진주 기자] 인공지능(AI) 번역기 간 성능 격차를 벌린 핵심 요인은 관련 기술로 볼 수 있다. 인공신경망 번역(NMT) 기술이냐, 통계 기반 번역(SMT) 기술이냐에 따라 크게 다른 결과를 보여줬다.NMT는 구글과 네이버(NAVER) 등이 자사 번역기에 앞다퉈 적용한 기술이다. 한때 '어색함의 대명사'라는 오명을 뒤집어쓴 구글 번역은 NMT 방식을 적용한 이후 한층 자연스러워졌다는 평가를 받고 있다. 이번 대회에서 구글이 1등을 할 수 있었던 비결은 NMT 기술을 기반으로 했기 때문이다.NMT 방식은 '문장' 전체를 넣어서 번역한다. 이렇다 보니 SMT 방식보다 정확도가 2배가량 높은 것으로 평가된다. NMT 방식은 번역하려는 문장과 번역된 문장을 쌍으로 두고 최적의 답을 찾는 중간값을 학습한다. 번역된 데이터를 활용해서 컴퓨터가 스스로 최적의 가중치를 두는 방식을 학습하는 것이다.기존에 쓰이던 SMT 방식은 많은 사람이 번역할 때 사용한 데이터베이스를 바탕으로 학습된 확률값에 따라 번역하는 방식이다. 번역하는 단위가 단어들로 구성된 구(Phrase)다. SMT 방식의 번역 서비스는 단위마다 번역해서 조합하는 방식이기 때문에 문장 내에서도 연결이 어색하다는 단점이 있다.한국어-영어 번역에 NMT 방식을 먼저 적용한 것은 네이버다. 지난해 10월 파파고에 NMT 방식을 적용했는데 200자 이내로 글자 수가 제한된다. 구글은 지난해 11월 한국어와 영어 간 번역에 NMT 방식을 접목했다. 5000자 이내로는 NMT 방식의 번역 결과를 제공한다. 구글은 내부의 '번역품질개선 평가기준'을 통해 NMT 방식 적용 이후 한국어 번역 품질이 0.94점의 개선 효과를 나타냈다고 밝힌 바 있다.

구글 번역

이번 대회에서 네이버가 구글에 밀린 것은 네이버의 경우 SMT 방식으로 답안을 작성했기 때문이다. 이번 문제는 모든 예시 문장이 철자 기준으로 200자를 넘었다. 이에 네이버 번역기는 자동으로 SMT 방식을 적용, 어색한 답안을 제출하고 만 것이다. 이런 점을 의식, 네이버는 오는 5월 중 NMT 방식 번역의 제한 글자 수를 늘릴 계획이라고 밝혔다. 네이버는 현재 영어-한국어, 한국어-중국어 쌍에 NMT 방식을 적용 중이다.구글이 상대적으로 나은 결과를 도출했다고는 하지만 아직은 인간 번역사에게 한참 밀린다. 번역에서는 문법이나 문맥, 행간의 의미까지 파악해내는 것이 중요한데 현재 AI는 이 부분에서 미흡하기 때문이다. 곽중철 한국외국어대학교 교수는 "글에는 인간의 말과 인간의 감성과 감정, 분노가 녹아들어 있는데 AI가 아무리 발전해도 정복하지 못하는 부분이 있다"며 "아무리 AI가 번역을 잘한다고 해도 인간이 중요한 결정을 해야 하는 번역물을 기계에 맡길 순 없을 것"이라고 말했다.한진주 기자 truepearl@asiae.co.kr<ⓒ세계를 보는 창 경제를 보는 눈, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>

산업2부 한진주 기자 truepearl@asiae.co.krⓒ 경제를 보는 눈, 세계를 보는 창 아시아경제
무단전재, 복사, 배포 등을 금지합니다.

오늘의 주요 뉴스

헤드라인

많이 본 뉴스