구글, 머신러닝 기술을 지메일·포토·번역 등에 적용해 성능 개선
[아시아경제 한진주 기자] "머신러닝에 필요한 4가지 요소는 컴퓨팅 능력, 훈련을 위한 데이터(예시), 인간의 창의성, 알고리즘이다."
구글이 머신러닝에 필요한 4가지 요소를 제시했다. 컴퓨팅 능력이 발전함에 따라 머신러닝이 최근 들어 급성장했지만, 인간이 처한 문제를 해결하기 위해서는 인간의 창의력이 중요하다고 소개했다.
10일 구글은 오후 7시 역삼동 구글코리아 대회의실에서 '구글포럼'을 열고 머신러닝 기술의 원리와 적용 현황 등에 대해 소개했다.
인공지능(AI)과 머신러닝의 차이는 스스로 학습하는 능력에서 구분된다. 인공지능은 사물을 똑똑하게 만드는 과학 기술을 통칭한다. 인공지능은 프로그램에 일일이 작동법을 입력해야 한다면, 머신러닝은 예시를 통해 스스로 학습한다.
그렉 코라도 구글 선임 연구원은 "머신러닝은 기계가 스스로 학습해서 더 똑똑해질 수 있도록 하는 것이며, 기계를 똑똑하게 만들기 위해서 SW를 프로그래밍 하는 것과는 개념이 다르다"고 소개했다.
머신러닝이 학습을 하기 위해서는 결과를 예측하는 SW(모델)가 필요하다. 예를 들어 수학공식에 숫자를 채워넣어야 원하는 값을 얻을 수 있는데, 여기서 수학공식은 소프트웨어(모델), 숫자는 파라미터(예시·데이터)다. 예측한 결과가 실제와 얼마나 일치하는지에 따라 파라미터를 지속적으로 개선하고, 이 과정을 거쳐 시스템이 개선된다.
머신러닝이 적용된 대표적인 서비스는 지메일이다. 스팸을 걸러내는 기술과 자동으로 답장하는 '스마트 리플라이'도 머신러닝을 적용한 서비스다.
구글은 2009년 만우절 농담으로 '자동 답장' 기능을 제공하겠다고 선언했고 지난해 11월 실제 서비스로 출시했다. 현재 지메일에서 수신되는 메일의 10%가 스마트 리플라이를 활용한 것이다. 머신러닝 기술은 이메일에 포함된 내용을 수학적 용어로 요약하고, 한 단어씩 답장을 작성한다.
구글은 머신러닝 기술을 다양한 서비스에 적용하고 있다. 안드로이드, 앱스, 지메일, 포토, 스피치, 검색, 번역, 유튜브 등에 적용되고 있다. 구글은 자체적으로 머신러닝 시스템 덕분에 구글 번역 서비스의 정확도가 55~85% 가량 개선됐다고 평가하고 있다.
머신러닝이 최근에 급속도로 발전할 수 있었던 계기는 CPU, GPU 등이 향상된 덕분이다. 컴퓨팅 능력 못지 않게 머신러닝을 훈련시킬 수 있는 방대한 사례(데이터)를 모을 수 있는 환경도 조성됐다.
머신러닝을 위한 알고리즘이자 툴은 '텐서플로'다. 구글은 텐서플로를 오픈소스로 공개했고, 개방된 스탠다드로 만들겠다는 목표를 가지고 있다. 텐서플로에는 딥러닝 툴이 내장돼있으며, 구글의 다양한 서비스에 적용되고 있다. 구글 포토 등이 대표적이다.
딥러닝은 뇌신경과 유사한 방식으로 작동되는데, 수십억개의 뉴런들이 각각 입력된 정보를 상위 뉴런에 전달하면 최상위 뉴런이 최종 예측 결과를 내놓는다. 고양이 사진을 보고 고양이의 눈, 코, 입, 털, 색깔, 모양, 생김새와 관련된 정보들을 종합해서 고양이라는 결론을 내리는 식이다.
이처럼 머신러닝 기술이 발전하고 있지만 결국 인간의 생활을 돕는 데 활용하려면 인간의 창의성이 중요하다고 강조했다.
그렉 연구원은 "머신러닝에서 창의력이 가장 많이 필요한 부분은 머신러닝이 어떤 문제를 해결할지, 목적과 문제를 정의하는 것인데 여기서 인간의 창의성이 가장 큰 힘을 발휘한다"고 설명했다.
한진주 기자 truepearl@asiae.co.kr
<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>