'포토스캐너' 앱으로 필름 사진 가장자리 훑어주면 디지털 이미지로 저장
구글 포토 '에디터' 기능 추가…자연스러운 노출 설정
문맥·흐름 자연스러워진 구글 번역…비결은 '신경망 기계번역'
[아시아경제 한진주 기자] 구글이 인공지능(AI)을 접목시켜 더 똑똑해진 '구글 포토'와 더 정확한 '구글 번역'을 선보였다. 오래된 필름 사진을 빠르게 디지털 사진으로 옮겨주는 '포토스캐너'도 출시했다.
29일 구글코리아는 역삼동 본사에서 'AI시대 : 구글 포토와 구글 번역' 간담회를 열고 '구글 포토'의 새로운 기능들과 문장 단위로 번역하면서 정확도를 높인 '구글 번역'에 대해 소개했다.
◆필름 사진→디지털 사진 변환해주는 '포토스캐너'= 앞으로 구글의 '포토스캐너' 기능을 이용하면 오래된 필름 사진도 디지털 이미지로 변환시켜 편리하게 보관·공유할 수 있다. 구글은 11월 안드로이드와 iOS용 '포토스캐너(PhotoScan)' 앱을 출시했다.
포토스캐너는 스캔하는 사진의 반사광을 제거해서 오래된 필름사진을 고품질 디지털 사진으로 만들어준다. 머신러닝 기술을 적용해 스캔한 사진의 가장자리를 감지해낸다. 앱을 실행한 후 사진의 네 모서리를 훑어주면 경계선이나 왜곡없이 고해상도 사진으로 변환해준다.
제임스 갤러거 구글 포토 소프트웨어 엔지니어링 디렉터는 "사진을 스캔할 때 1분이 걸리고 인쇄된 사진을 촬영하면 경계선이 흐트러지거나 반사광 때문에 해상도가 낮아지는데, 구글은 이 문제를 해결하기 위해 '포토스캐너'를 출시했다"며 "구글포토로 이 사진을 저장하고 원하는대로 정리정돈해서 쉽게 검색도 가능하다"고 말했다.
이밖에도 구글 포토에 '에디터 기능'과 '컨셉 무비 제작' 기능 등이 추가됐다. 사진에서 '연필' 모양의 버튼을 누르면 오토인핸싱 기능을 이용할 수 있는데 이 기술은 얼굴 주변 노출을 최적화시켜 준다. 또한 중요한 순간의 사진들을 모아서 컨셉무비로도 만들 수 있다.
구글 포토는 지난해 5월 출시된 사진관리 서비스다. 포토스캐너에서 제작한 디지털 사본 이미지는 탭 한번으로 구글 포토에 저장할 수 있고 정리, 검색, 공유도 가능하다.
제임스 갤러거 디렉터는 "구글 포토는 인터넷에 공개된 방대한 양의 이미지를 사용해서 트레이닝을 한다"며 "이러한 이미지들간 유사점이 무엇인지 살펴보고, 구글 이미지검색을 활용해서 특정 단어를 검색할 때 나오는 이미지와의 연간관계를 통해 훈련한다"고 설명했다.
◆"문장 단위로 번역" 더 똑똑해진 '구글 번역'= 딱딱하고 어색한 번역의 대명사였던 '구글 번역'이 11월부터 더 자연스럽고 똑똑해졌다. 구글은 '신경망 기계번역'을 도입하면서부터다. 기존에는 문장을 번역할 때 단어나 어구로 일일이 쪼개서 번역했지만 신경망기계번역은 문장 전체를 하나의 단위로 번역해 훨씬 자연스럽다.
'신경망 기계번역'은 현재 한국어를 비롯해 영어, 스페인어, 포르투갈어, 프랑스어, 독일어, 터키어, 중국어, 일본어에 적용중이다. 구글 측은 언어를 조합할 때 번역에서의 오류가 55~85% 가량 줄어들었다고 밝혔다.
버락 투로프스키 구글 번역 프로덕트 총괄은 "신경망기계번역이 출시된 이후 구글의 전체 번역요청의 35%를 차지하기 시작했다"며 "구글번역은 지난 10년간 쌓은 발전보다 더 도약할 수 있게 됐다"고 말했다.
구글은 '신경망 기계번역'을 도입할 때 자체 머신러닝 툴인 '텐서플로'를 활용했다. 텐서플로를 활용해서 다른 신경망 번역 서비스보다 3배 내지 8배 더 빠르게 번역할 수 있게 개선했다는 설명이다. 또한 구글은 언어를 번역할 때 비슷한 구조를 가진 다른 언어도 함께 트레이닝 시키는 방법을 썼다. 신경망기계번역으로 영-한 번역을 학습시킬 때, 구조가 비슷한 일본어도 함께 훈련시키는 식이다.
버락 투로프스키 총괄은 "영어와 비슷한 형식의 다중언어를 한꺼번에 훈련시킴으로써 정확도를 개선시키고, 자원을 적게 들이면서 새로운 언어에 신경망기계번역을 도입할 수 있었다"며 "우리의 궁극적 목표는 신경망 기계번역을 지원하는 103개 언어에 지원하는 것"이라고 설명했다.
구글 번역은 매일 10억개 이상, 하루 1400개 이상의 단어를 번역한다. 현재 전 세계 5억 명 이상이 사용하고 있으며 103개 언어를 지원한다. 텍스트·사진·음성·손글씨 등 다양한 입력 방법을 제공하고 있다.
한진주 기자 truepearl@asiae.co.kr
<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>