-사진에 나온 물체의 위치와 개수 등을 문장으로 번역
-아직은 초기단계…큰 이미지에는 한계
[아시아경제 최동현 기자] 구글이 사진에 나온 장면을 정확한 문장으로 묘사할 수 있는 소프트웨어를 개발했다.
18일(현지시각) 미국 매사추세츠공대(MIT)가 펴내는 과학기술 전문잡지인 '테크놀로지 리뷰'에 따르면 구글 연구원들은 최근 사진을 정확한 문장으로 설명할 수 있는 소프트웨어를 개발했다. 예컨대 아이들이 게임을 하고 있는 사진을 입력하면 이 소프트웨어는 "젊은 사람들이 게임을 하고있다"는 문장을 즉각 표시한다.
과거에도 사진을 이해하는 소프트웨어를 개발하기 위한 많은 노력들이 있었지만 대부분 개별적인 사물을 확인하는 수준에 그쳤다. 그러나 구글이 이번에 개발한 소프트웨어는 사물의 개수와 위치까지도 설명할 수 있다. 만약 테이블 위에 피자 두 개가 놓여진 사진을 실행하면 "테이블 위에 피자 두 개가 놓여 있다"는 텍스트 메시지가 출력된다. 이 프로그램을 개발한 한 구글 연구원은 "향후 이 소프트웨어를 응용한 잠재성이 뛰어난 앱들이 만들어질 것으로 확신한다"고 밝혔다.
구글 연구원들은 서로 다른 작업을 위해 별도로 개발된 두 개의 네트워크를 연결하는 일종의 디지털 뇌수술을 통해 이번 소프트웨어를 개발했다고 밝혔다. 하나의 네트워크는 이미지에 담긴 내용을 수학적으로 표현하는 것이며, 다른 하나는 자동 번역 소프트웨어의 일부로 완전한 영어 문장을 생성하는 것이다. 이 둘을 적절하게 조합시킨 것이 이번 소프트웨어의 개발로 이어졌다는 설명이다.
그러나 구글 연구원들은 여전히 이러한 소프트웨어를 개발하고 테스트하는 것의 초기 단계에 머물러 있다고 언급했다. 한 구글 연구원은 "이 소프트웨어는 아직 크기가 큰 이미지를 묘사하는 데는 한계가 있다"며 "앞으로 가야할 길이 멀다"고 말했다.
최동현 기자 nell@asiae.co.kr
<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>