한국말 알아듣는 1호 AI…SK텔레콤 '누구' 공개(일문일답)

[아시아경제 박소연 기자]"팅커벨, 몇살이니?""나이는 숫자에 불과합니다""팅커벨 , 가을에 듣기 좋은 노래 들려줘""분위기 있는 음악 채널을 들려드릴께요"(음악이 흐른다)"팅커벨, 이노래 뭐야?""윤건의 '힐링이 필요해'입니다"이 인공지능(AI) 스피커를 선보이며 'AI 대중화 시대 개막'을 선언했다.SK텔레콤은 31일 음성인식 기반 인공지능 서비스 '누구(NUGU)'와 전용 기기를 공개했다.누구는 고도화된 음성인식 기술과 인공지능 엔진을 통해 고객이 원하는 것을 파악, 수행하는 서비스다. 누구는 문장 형태를 알아듣고(자연어 처리), 스스로 학습해서 진화(딥러닝)한다.해외서는 아마존의 '알렉사'나 마이크로소프트의 '코타나' 등이 유사한 AI 비서 서비스를 제공하고 있지만 한국말로 이용 가능한 서비스는 SK텔레콤의 누구가 최초다.누구는 SK텔레콤이 자체 개발한 음성인식 기술과 AI 엔진을 통해 상용화까지 성공했다는 점에서 의미가 크다.누구는 고객의 음성을 파악, ▲조명, 제습기, 플러그, TV 등 가전기기 제어 ▲음악추천 및 자동 재생▲날씨, 일정 등 정보 안내 ▲스마트폰 위치 찾기 등 다양한 정보와 편의를 제공한다.예컨대 "신나는 음악을 틀어줘"라고 말하면 경쾌한 음악을 자동으로 선곡 재생해주며, 음악 정보를 물으면 가수, 제목 등을 답해준다. 또 "야구장에 갈건데, 내일 인천 날씨 어때?"라고 물으면 해당 지역의 날씨 정보를 음성으로 안내한다.누구는 소프트웨어 업그레이드만으로 새로운 기능을 추가할 수 있다.이를 통해 SK텔레콤은 ▲인터넷 쇼핑, 배달 음식 주문 등 커머스▲T맵 연계 실시간 빠른 경로 안내, 간편 지식 검색 등 생활정보 ▲인터넷라디오 재생, 뉴스ㆍ구연동화 낭독 등 고객 선호에 맞춘 다양한 기능을 누구에 순차적으로 반영하고 고도화해 나갈 계획이다.누구를 탑재한 첫번째 전용 스마트 기기는 원통형 디자인(높이 21.5㎝, 지름 9.4㎝)에 가정용으로 최적화된 스피커형 인공지능 디바이스다. 음성인식률이 극대화될 수 있도록 마이크를 기기 상단에 배치하고, 분위기에 따라 색상을 바꾸는 LED조명을 탑재하는 등 기능성과 미관을 모두 고려해 디자인됐다. 특히 가정용 누구는 명품 오디오 브랜드 '아스텔앤컨'이 음질 최적화를 위한 음향 설계에 참여해 가정용 프리미엄 스피커로도 탁월한 성능을 보유하고 있다.SK텔레콤은 가정용 누구를 출시한 데 이어 차량용 사물인터넷(IoT), 신체 부착형 IoT, 휴머노이드 로봇 등 다양한 디바이스에 누구 서비스를 접목할 예정이다.박일환 SK텔레콤 디바이스 지원단장은 "과거 키보드에서 마우스로, 이후 터치로 입력방식이 진화하며 우리의 일상이 크게 변해왔다"며 "누구를 시작으로 음성인식과 인공지능이 생활 전반을 획기적으로 바꿔가는 AI 대중화시대를 열어가겠다"고 말했다.다음은 SK텔레콤 측과의 일문일답이다.-누구 디바이스가 자체 통신기능을 가지고 있는 것인지. 스마트폰으로 연동되서 작동을 하는 것인지. 요금제가 있는 것인지. SK 주식회사 C&C도 왓슨을 이용해서 해당 서비스를 개발중이고 스피커 형태 디바이스를 개발중이라고 아는데 관련이 있는 것인지▲자체 통신 기능은 와이파이 기능을 가지고 있다. 독자적으로 통신을 할 수 있고 단 스피커가 동작하기 위해서는 처음에는 스마트폰 앱을 통해 접속하는 일들을 진행을 하게 된다. 그 이후 독자적으로 동작한다. 이 디바이스로 추가 요금은 없다. 두번째 인공지능은 분야가 여러 분야다. 왓슨이 추구하는 분야는 오히려 전문가 시스템에 가깝다고 봐야 할 것 같고 왓슨의 방향은 B2B이고 반면 저희 인공지능은 B2C에 초점이 맞춰져 있다. 지금은 따로 움직이는 것처럼 보이지만 시간이 가면서 서로 잘 할 수 있는 부분은 협력을 하지 않을까 싶다.(박일환 SK텔레콤 디바이스지원단장)-목소리가 누군지 궁금하고, 팅커벨이라고 불렀는데 부르는 사람이 이름을 바꿔도 되는 것인지. 한국어로만 가능한지도 궁금하다. 무료라고 하셨는데 멜론이 유료인데 다른 통신사를 쓰는 사람도 이것을 사면 멜론을 무료로 이용할 수 있는지▲오늘 누구의 목소리가 마음에 드셨다니 기분이 좋다. 개인정보보호 이슈로 실명을 밝힐 수 없어 이해를 부탁드린다. 다양한 성우 목소리를 테스트를 해서 가장 감성적인 목소리를 가진 성우를 채택해서 녹음을 했다. 현재 누구는 초기 단계에는 4가지 정도 이름으로 부를 수 있다. 팅커벨 아리아 크리스탈 레베카 4가지 이름으로 명령을 내릴 수 있다. 향후에는 부장님 , 향단이 이런 이름으로 부를 수 있도록 빠른 시간안에 구현을 하겠다. 멜론 서비스에 대한 질문은 초기 사업방향은 음성인식 인공지능 서비스에 대한 체험과 확산이 목표다. 초기 구매자에 대해서는 멜론 서비스 3개월 무료로 제공한다. 이후에는 멜론에 가입해서 이용할 수 있다. 앱 연동방법은 누구 앱이 있다. 누구 앱에서 아이디를 통해 회원가입을 하고 스마트홈 단말에 연동 등을 통해 이용할 수 있다.(김성한 SK텔레콤 디바이스기획본부장)-시연에서 실수한 부분이 발음이 안좋아서 사람의 말을 인식하지 못한다기보다는 다양한 말을 수집을 해야 될텐데 문장을 어떻게 팅커벨에 접목했는지. 예상 연내 가입자 숫자는.▲가입자 부분은 비밀이다. 많은 분들이 오실겁니다만은 굉장히 많은 할인혜택을 드리기 때문에 제한된 숫자의 고객들을 모실 수 있을 것 같다.(박일환)인식과 관련된 데이터 수집 관련 자연어 처리를 SK텔레콤이 2011년부터 시작을 했다. 누구 서비스 전에 한국어 관련 자연어 데이터 베이스는 많이 가지고 있었다. 음악 관련 도메인을 데이터를 구축을 했고 그외 일반적인 것들은 저희가 이전부터 쌓아왔던 것이다. 지금까지 쌓아왔던 것보다 누구 출시를 통해 받아들이는 데이터가 현실적이라고 생각한다. 고객들이 바라는 데이터 분석을 해서 세미 리얼타임 형태로 구축해 나갈 계획이다.(박명순 SK텔레콤 미래기술원장)-음성인식과는 별도로 인공지능은 머신러닝을 통해 같은 질문을 해도 다른 방법을 찾는 것이 필요한데 자체 개발을 어떻게 하셨는지 스피커와 마이크만 있고 디스플레이는 없는데 ▲음성인식 관련해서 지금 다양한 데이터들이 저희가 지금껏 모았던 데이터보다 사용함으로써 들어오는 데이터들이 다양할 것 같다. 머신러닝 인프라가 200대 정도 서버 등 구비가 돼 있다. 앞으로 수집할 데이터는 위클리 단위로 모아서 학습을 해서 엔진에 반영할 계획을 가지고 있다. 해당 관련 기술은 저희가 자체적으로 개발을 해서 SKT내부 개발자들이 계속 진행할 계획이다. 누구 디바이스 자체가 음성 인터페이스를 기반으로 하기 때문에 음성은 가장 좋은게 가장 자연스러운 인터페이스라고 생각해 디스플레이가 혼란을 줄 것 같고, 음성 인터페이스의 가능성에 대해 시도해 보고 싶었다.(박명순)음성 UX는 터치 UX와 다르게 음성은 큐레이션된 최상의 답변과 서비스를 제공하는 것이 장점이다. 사업 초기에는 디스플레이 부분들을 붙이지 않았고, 다양한 서비스를 확장해 나갈 예정이다. 서비스에 최적화된 단말은 계속 확대해 나갈 예정이다. 웨어러블 등 최적화된 단말의 형태로 구현이 가능할 것이다. 고객 니즈를 확인해 출시를 검토할 예정이다.(김성한)-음성인식 인공지능 기기는 아마존 에코, 구글 홈처럼 앞다퉈 뛰어들고 있는데 장기적으로 그런 업체들과 경쟁을 피할 수 없을 것으로 보는데 , SKT의 장점 차별화 부분은. 기기를 구입을 하면 소프트웨어 업데이트를 통해 머신러닝 된 결과를 반영할 수 있느 것인지 별도의 기기를 구매해야 하는지.▲AI사업은 범위가 넓다. 산업 전반의 메인 트렌드이기 때문에 각 사업자들이 다양한 방법으로 인공지능 서비스를 준비하고 있다. 하나로 비교 평가할 수는 없지만 3가지 관점에서 경쟁력이 있다. 기술적 음성인식 영상인식 자연어처리 부분에서 국내 최초로 장기 투자해서 상당부분 완성도를 높여왔다. 두번째 하드웨어 측면을 말씀드리면 아마존 에코와 비교를 해보면 누구 디바이스는 디자인적으로 감성적인 포인트를 가지고 있다 . 외부의 무드 등을 채택함으로써 고객들과 감성적인 부분. 멜론 서비스를 음질 서비스 측면에서 보면 자회사인 아이리버 전문가들이 튜닝 작업에 참여했다. 블라인드 테스트에서 좋은 반응을 얻었다. 서비스 측면에서 SKT에서 자체적으로 보유하고 있는 시장내에서 인정받고 있는 T맵, Btv 등을 음성인식과 연계해 초기 서비스에서 강점을 가지고 갈 수 있을 것 같다. 국내 지형에 맞는 서비스를 통해 경쟁 우위를 가져갈 수 있을 것으로 기대한다. 디바이스 측면에서는 서비스 업데이트 할때 신규 기기 구입할 필요없다. 소프트웨어 업데이트를 통해 제공할 것이다.(김성한)-멜론 , 날씨 알림 등 클라우드 상에서 이뤄지는 것인지 스마트폰 상의 검색 결과가 나오는 것인지. 누구 개발은 SKT에서 개발하신건지 스타트업 등과 협력하신 것인지.▲클라우드 상에서 일어나는 서비스고 스마트폰은 중간에 관여하지 않는다. 기본적으로 클라우드 상에서 모든일이 일어난다고 보시면된다. (박일환)누구 개발 파트너는 음성인식, 영상인식, 언어처리 쪽은 내부 기술진들이 개발했다. 누구 디바이스는 개발 파트너링을 하고 있고 튜닝은 아이리버 사에서 했고, 앱을 만들거나 하는 부분은 기본 비즈니스 파트너사와 함께 했다. 개별 서비스를 다 개발할 수 없기때문에 내년에는 API 개방을 할 예정이다.(박영순)-음성을 기억할 때 다른 사람들이 팅커벨이라고 불러도 되는 것인지. 집에 다른 사람이 왔는데 마음대로 조정을 할 수 있다면 개인정보 유출 등 문제가 있을 수 있다.▲지금은 개인별로 식별을 하지는 않는다. 당장이라고 물으시면 엄마가 불러도 아빠가 불러도 팅커벨이라는 웨이크업 워드로 사용을 할 수있고 이후에는 음성으로 화자 인증을 하는 기술을 가지면서 아기가 불렀을때 엄마가 불렀을때 서비스를 달리 가져가는 것을 계획을 하고 있다.(박영순)-11번가에서 주문을 하려면 주소나 개인정보, 결제를 하려면 그런 데이터가 연결이 되는 것인데 데이터 보호 문제 등이 궁금하다. 시연을 하면서 간섭이 있었던 것 같은데 아파트도 마찬가지다. 티비나 라디오 등도 틀어놓을 수 있는데 그런것들을 구분하는 기술은 어떻게 되나. 지금은 여성 음성인데 향후 남성음성으로도 서비스 가능한지▲지금도 시연할 때 실패를 했던 것이 피자 주문 접수가 중요한 확인하는 과정인데 그부분에 음을 잡는 것을 정확도를 높여놨다. 정확하게 인증되지 않으면 취소되도록 돼 있다. 현재는 누구 디바이스로 결제가 되는 것은 없다. 향후 저희가 여러가지 페이라든지 이런 것들이 들어가고 음성을 통한 인증등이 들어가면서 고민을 더 많이 해야한다. 실제 결제는 오프라인 방식으로 현재는 진행된다. 데이터에 대해서는 학습을 하는 용도로 아이디는 떼고 익명으로 활용을 한다. 그외에 다른 개인정보와 관련된 것들은 활용하지 않고 있다. 아파트 환경에서 와이파이를 쓰게 되는데 대역들을 셔플링해서 쓰기 때문에 일순간 집에서 인터넷 쓸때도 깜빡하거나 딜레이 하는 부분이 발생하는데 저희가 전송하는 데이터 량이 그렇게 많지 않다. 음성 보내고 받는 것. 딜레이나 유실이 된다는 것은 와이파이 쓰기 때문에 나타날 수 있다. 지금은 성우 목소리로 녹음을 하고 일부는 성우 목소리를 합성하는 기술을 접목을 하고 있다. 아직은 자연스러운 부분을 위해 성우목소리가 많은데 합성하는 기술들이 좀 더 발전을 하게 되면 합성 분량이 늘어날 것 같고 남성이나 애기라던지 향후에는 합성기술로 다양하게 확장할 계획이다. 당분간은 이런 목소리로 서비스를 하게 될 것 같다.(박영순)-누구 관련해서 한국어 자연어 처리 데이터는 구축이 돼 있다고 하는데 , 다국어 지원도 되는지 수출용은 아닌 것인지▲현재는 한국어 중심이다 사실 다국어는 많은 인력들이 필요한데 거기까지는 돼 있지 않다. 영어는 지금 개발보다 영어 처리하는 파트너사와 협업하는게 낫다고 본다. (박영순)박소연 기자 muse@asiae.co.kr<ⓒ세계를 보는 창 경제를 보는 눈, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>

산업2부 박소연 기자 muse@asiae.co.krⓒ 경제를 보는 눈, 세계를 보는 창 아시아경제
무단전재, 복사, 배포 등을 금지합니다.

오늘의 주요 뉴스

헤드라인

많이 본 뉴스