본문 바로가기
bar_progress

글자크기 설정

닫기

"이제는 멀티모달이다" 오픈AI-구글, 음성 AI 비서 내놔

시계아이콘01분 41초 소요
숏뉴스
숏 뉴스 AI 요약 기술은 핵심만 전달합니다. 전체 내용의 이해를 위해 기사 본문을 확인해주세요.

불러오는 중...

닫기
뉴스듣기 글자크기

시·청각 인식…사람처럼 대화까지
강력한 AI 모델…시장 선점 경쟁
편의성 높이고 비서 역할 할듯

오픈AI와 구글의 생성형 인공지능(AI) 기술 전쟁이 본격화됐다. 양사가 잇따라 더 강력한 기능으로 업그레이드된 AI 모델을 내놓으면서 글로벌 주도권을 선점하려는 경쟁에 돌입했다. 그동안에는 텍스트로 AI 기능을 수행했다면 이제는 이미지, 오디오, 비디오 등 다양한 데이터를 학습한 멀티모달(multi modal) 기술로 대결을 벌일 전망이다.

"이제는 멀티모달이다" 오픈AI-구글, 음성 AI 비서 내놔 13일(현지시간) 미 캘리포니아주 마운틴뷰 쇼어라인 엠피씨어터에서 열린'구글 연례 개발자 회의(I/O)' 모습. [이미지출처=연합뉴스]
AD
구글 앱들과 시너지…AGI ‘아스트라’도 공개

구글은 자사의 검색 엔진에 생성형 AI ‘제미나이’를 탑재해 눈길을 끌었다. 구글은 지난 14일(현지시간) 미국 캘리포니아주 마운틴뷰에서 개최한 연례 개발자 회의에서 제미나이를 통해 AI의 미래를 현실화하기 위한 비전을 발표했다. 먼저 검색 결과를 빠르게 요약하고 관련 링크를 제공받을 수 있는 ‘AI 개요’ 기능을 선보였다. 대화 형태로 검색할 수 있고 사진뿐만 아니라 동영상으로도 검색이 가능해진다. 제미나이가 탑재된 새 검색기능은 미국을 시작으로 수개월 안에 다른 국가에도 제공될 예정이다.


AI 음성 모델을 기반으로 하는 범용인공지능(AGI) 프로젝트 아스트라(Astra)도 공개했다. 아스트라는 AI가 사람처럼 보고 들을 수 있고 음성으로 대화하면서 이용자의 개인 비서 역할을 한다. 시연 영상에서는 스마트폰 카메라로 주변 상황을 보여주고 안경이 어디에 있는지를 묻자 이를 알려줬다. 안경을 치운 후 방금 있었던 물건이 무엇인지 물으면 ‘안경’이라고 답하는 능력도 있다. 구글 지도와 결합하면 더욱 시너지를 낸다. 이용자의 현재 위치를 파악해 음성으로 알려줄 수 있기 때문이다. 아스트라는 스마트폰이나 컴퓨터뿐만 아니라 스마트 안경 등 다른 IT 기기에서도 구현이 가능할 것으로 기대된다.


구글은 아스트라로 가기 위한 전 단계인 ‘제미나이 라이브’도 선보였다. 이날 시연 영상에선 사용자가 카메라로 신발을 보여주며 반품 의사를 밝히자, 제미나이가 신발 구매 이력을 찾아 쇼핑몰에 반품 요청을 했다. 구글 캘린더에 신발 픽업 일정 표시까지 해줬다. 취업 면접 준비나 연설 리허설 등에도 도움을 줄 수 있을 것으로 보인다. 구글은 제미나이 라이브를 올해 안에 출시하고, 아스트라 구현을 위한 기능도 추가할 계획이다. 구글이 맞춤형·개인화된 AI 기능을 활용하는 동시에 광고 수익도 유지할 수 있을지는 숙제로 남아있다.

"이제는 멀티모달이다" 오픈AI-구글, 음성 AI 비서 내놔 샘 올트먼 오픈AI 대표 [이미지출처=연합뉴스]
사람 같은 GPT-4o "혁명과도 같다"

오픈AI는 구글의 행사를 하루 앞두고 GPT-4o(포오)를 전격 공개했다. 아스트라와 비슷하게 이용자와 실시간으로 음성 대화를 나누고 시청각으로 추론하며 질문에 답을 할 수 있는 똑똑한 음성 AI 비서다. GPT-4o는 한국어를 포함해 50개 언어로 인식하며, 수학 문제를 보여주면 풀이 과정을 설명해주는 기능도 갖고 있다.


국내 스타트업 대표들은 GPT-4o가 공개되자 놀라움을 감추지 못했다. 빅데이터 테크기업 ‘인라이플’의 한경훈 대표는 "높은 수준의 실시간 대화가 가능해진 GPT-4o는 각종 비즈니스와 교육, 금융 등 사회의 다양한 영역에서 큰 영향력을 미치게 될 것"이라며 "AI 기술의 개발과 활용에서 변혁기를 가져올 것"이라고 했다. 김동환 포티투마루 대표는 "멀티모달이 본격적으로 적용되면서 혁명과도 같은 일이 생겼다"며 "AI가 일상에 깊숙이 스며드는 이정표가 될 것"이라고 평가했다.



하지만 두 모델 중 어떤 것이 더 우위에 있다고 판단하기엔 아직 이르다. MIT 테크놀로지 리뷰는 "정식 버전을 직접 경험하지 않고는 어느 게 더 낫다고 말하기 어렵다"며 "데모 영상 등에선 이미 사전에 연습한 작업을 선보였을 가능성이 있기 때문에 정식 출시가 됐을 때 진정한 시험대에 올라갈 것"이라고 했다. 향후 애플 아이폰에 둘 중 어떤 생성형 AI 모델이 탑재될지, 또 AI가 거짓 정보를 알려주는 환각 현상을 얼마나 줄였는지 살펴봐야 할 것으로 보인다.




김보경 기자 bkly477@asiae.co.kr
<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>

AD
AD

당신이 궁금할 이슈 콘텐츠

AD

맞춤콘텐츠

AD

실시간 핫이슈

AD

다양한 채널에서 아시아경제를 만나보세요!

위로가기